Publicado: 10 de junho de 2024 às 7h22 Atualizado: 10 de junho de 2024 às 7h22
Editado e verificado: 10 de junho de 2024 às 7h22
em resumo
A Kuaishou Technology revelou o Kling AI, uma ferramenta para gerar vídeos realistas a partir de prompts de texto, posicionando-o como rival do Sora da OpenAI.
A empresa de tecnologia chinesa Kuaishou Technology, conhecida por sua comunidade de conteúdo e plataforma social, revelou o Kling AI, uma nova ferramenta projetada para gerar vídeos altamente realistas a partir de prompts de texto, representando um concorrente potencial do modelo Sora da OpenAI.
Sora é um modelo de IA projetado para gerar cenas realistas e criativas com base em entrada de texto. Central para os recursos de geração de vídeo do Sora é uma estrutura de aprendizado profundo. O modelo aprende associações entre palavras e frases com vários elementos como objetos, ações, ambientes e nuances estilísticas.
Enquanto o modelo Sora da OpenAI é capaz de gerar vídeos de até um minuto de duração, o Kling AI pode produzir vídeos realistas de até dois minutos com resolução de 1080p a 30 quadros por segundo. Ele suporta múltiplas proporções e atinge um alto nível de detalhe por meio de técnicas avançadas de reconstrução facial e corporal em 3D, garantindo que seus vídeos gerados por IA sejam virtualmente indistinguíveis das imagens reais.
Kling AI utiliza um Autoencoder Variacional 3D (VAE) para reconstruir rostos e corpos, permitindo a geração de expressões detalhadas e movimentos de membros a partir de uma única imagem de corpo inteiro. Esta tecnologia é aprimorada por um mecanismo de atenção conjunta espaço-temporal 3D, melhorando a capacidade do modelo de lidar com cenas e movimentos complexos. Isso garante que o conteúdo gerado mantenha consistência com as leis da física.
A aplicação adota uma abordagem de acesso aberto, embora com limitações regionais. O modelo está atualmente funcionando em fase de testes.
Kuaishou Technology revela modelo de texto para imagem KwaiYii LLM e Kolors
A Kuaishou Technology está entre várias empresas de tecnologia chinesas que competem para introduzir alternativas ao Sora. A capacidade de texto para vídeo representa sua mais recente inovação em IA, após a introdução de seu modelo de linguagem grande KwaiYii (LLM) e do modelo de texto para imagem Kolors, que estreou em maio.
Além disso, o recurso “AI Dancer”, acessível no aplicativo Kuaishou Technology e no aplicativo de produção de vídeo Kwaiying, permite aos usuários fazer upload de uma foto estática e gerar vídeos apresentando o personagem dançando em ritmos e movimentos específicos.
Isenção de responsabilidade
De acordo com as diretrizes do Trust Project, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometido com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Alisa, uma jornalista dedicada do MPost, é especializada em criptomoedas, provas de conhecimento zero, investimentos e no reino expansivo da Web3. Com um olhar atento às tendências e tecnologias emergentes, ela oferece uma cobertura abrangente para informar e envolver os leitores no cenário em constante evolução das finanças digitais.
Mais artigos
Alice Davidson
Alisa, uma jornalista dedicada do MPost, é especializada em criptomoedas, provas de conhecimento zero, investimentos e no reino expansivo da Web3. Com um olhar atento às tendências e tecnologias emergentes, ela oferece uma cobertura abrangente para informar e envolver os leitores no cenário em constante evolução das finanças digitais.
source – mpost.io