Friday, May 10, 2024
HomeAppsMeta lança modelo de IA SeamlessM4T para traduzir idiomas em tempo real

Meta lança modelo de IA SeamlessM4T para traduzir idiomas em tempo real

A empresa controladora do Facebook, Meta Platforms, lançou na terça-feira um modelo de IA capaz de traduzir e transcrever fala em dezenas de idiomas, um alicerce potencial para ferramentas que permitem a comunicação em tempo real através de divisões linguísticas.

A empresa disse em um blog que seu modelo SeamlessM4T poderia suportar traduções entre texto e fala em quase 100 idiomas, bem como tradução completa de fala para fala em 35 idiomas, combinando tecnologia que anteriormente estava disponível apenas em modelos separados.

O CEO Mark Zuckerberg disse que prevê tais ferramentas facilitando as interações entre usuários de todo o mundo no metaverso, o conjunto de mundos virtuais interconectados no qual ele aposta o futuro da empresa.

A Meta está disponibilizando o modelo ao público para uso não comercial, disse o blog.

A maior empresa de mídia social do mundo lançou uma série de modelos de IA, em sua maioria gratuitos, este ano, incluindo um grande modelo de linguagem chamado Llama, que representa um sério desafio aos modelos proprietários vendidos pela OpenAI, apoiada pela Microsoft, e pelo Google, da Alphabet.

Zuckerberg diz que um ecossistema aberto de IA funciona a favor da Meta, já que a empresa tem mais a ganhar com o crowdsourcing eficaz para a criação de ferramentas voltadas para o consumidor para suas plataformas sociais do que cobrando pelo acesso aos modelos.

No entanto, a Meta enfrenta questões jurídicas semelhantes às do resto da indústria em torno dos dados de treinamento ingeridos para criar seus modelos.

Em julho, a comediante Sarah Silverman e dois outros autores entraram com ações judiciais por violação de direitos autorais contra a Meta e a OpenAI, acusando as empresas de usarem seus livros como dados de treinamento sem permissão.

Para o modelo SeamlessM4T, os pesquisadores da Meta disseram em um artigo de pesquisa que coletaram dados de treinamento de áudio de 4 milhões de horas de “áudio bruto proveniente de um repositório publicamente disponível de dados rastreados da web”, sem especificar qual repositório.

Um porta-voz da Meta não respondeu às perguntas sobre a procedência dos dados de áudio.

Os dados de texto vieram de conjuntos de dados criados no ano passado que extraíram conteúdo da Wikipedia e de sites associados, disse o artigo de pesquisa.

©ThomsonReuters 2023

source – www.gadgets360.com

Isenção de responsabilidade: Não somos consultores financeiros. Por favor, faça sua pesquisa antes de investir, nenhum jornalista da Asiafirstnews esteve envolvido na criação deste conteúdo. O grupo também não é responsável por este conteúdo.
Disclaimer: We are not financial advisors. Please do your research before investing, no Asiafirstnews journalists were involved in the creation of this content. The group is also not responsible for this content.

Sandy J
Sandy J
Hi thanks for visiting Asia First News, I am Sandy I will update the daily World and Music News Here, for any queries related to the articles please use the contact page to reach us. :-
ARTIGOS RELACIONADOS

Mais popular