Meta lança modelo de IA SeamlessM4T para traduzir idiomas em tempo real

January 25, 2024

182

A empresa controladora do Facebook, Meta Platforms, lançou na terça-feira um modelo de IA capaz de traduzir e transcrever fala em dezenas de idiomas, um alicerce potencial para ferramentas que permitem a comunicação em tempo real através de divisões linguísticas.

A empresa disse em um blog que seu modelo SeamlessM4T poderia suportar traduções entre texto e fala em quase 100 idiomas, bem como tradução completa de fala para fala em 35 idiomas, combinando tecnologia que anteriormente estava disponível apenas em modelos separados.

O CEO Mark Zuckerberg disse que prevê tais ferramentas facilitando as interações entre usuários de todo o mundo no metaverso, o conjunto de mundos virtuais interconectados no qual ele aposta o futuro da empresa.

A Meta está disponibilizando o modelo ao público para uso não comercial, disse o blog.

A maior empresa de mídia social do mundo lançou uma série de modelos de IA, em sua maioria gratuitos, este ano, incluindo um grande modelo de linguagem chamado Llama, que representa um sério desafio aos modelos proprietários vendidos pela OpenAI, apoiada pela Microsoft, e pelo Google, da Alphabet.

Zuckerberg diz que um ecossistema aberto de IA funciona a favor da Meta, já que a empresa tem mais a ganhar com o crowdsourcing eficaz para a criação de ferramentas voltadas para o consumidor para suas plataformas sociais do que cobrando pelo acesso aos modelos.

No entanto, a Meta enfrenta questões jurídicas semelhantes às do resto da indústria em torno dos dados de treinamento ingeridos para criar seus modelos.

Em julho, a comediante Sarah Silverman e dois outros autores entraram com ações judiciais por violação de direitos autorais contra a Meta e a OpenAI, acusando as empresas de usarem seus livros como dados de treinamento sem permissão.

Para o modelo SeamlessM4T, os pesquisadores da Meta disseram em um artigo de pesquisa que coletaram dados de treinamento de áudio de 4 milhões de horas de “áudio bruto proveniente de um repositório publicamente disponível de dados rastreados da web”, sem especificar qual repositório.

Um porta-voz da Meta não respondeu às perguntas sobre a procedência dos dados de áudio.

Os dados de texto vieram de conjuntos de dados criados no ano passado que extraíram conteúdo da Wikipedia e de sites associados, disse o artigo de pesquisa.

source – www.gadgets360.com

Meta lança modelo de IA SeamlessM4T para traduzir idiomas em tempo real

Laura inamedinova do Gate.io lidera as principais discussões de investimentos da Web3 e Crypto em Davos 2025

Os agentes da IA combinarão com os engenheiros de ‘bom nível médio’ este ano, diz Mark Zuckerberg

Don’t Starve juntos ainda está chegando ao celular, mas não para a Netflix

Perplexidade ai sugere uma possível integração de criptografia

Aqui é onde você pode tentar comprar um NVIDIA RTX 5080 ou 5090

Meus amigos que gostam de tecnologia desejam que o Android tenha esse recurso escondido do FaceTime

Facas fora 3 e a manchete de Frankenstein de Guillermo del Toro.

Você em breve poderá usar o Google Maps dentro de uma UI 7’s Now Bar

Mais popular

Laura inamedinova do Gate.io lidera as principais discussões de investimentos da Web3 e Crypto em Davos 2025

Os agentes da IA combinarão com os engenheiros de ‘bom nível médio’ este ano, diz Mark Zuckerberg

Don’t Starve juntos ainda está chegando ao celular, mas não para a Netflix

Perplexidade ai sugere uma possível integração de criptografia

Categorias populares