A empresa controladora do Facebook, Meta Platforms, lançou na terça-feira um modelo de IA capaz de traduzir e transcrever fala em dezenas de idiomas, um alicerce potencial para ferramentas que permitem a comunicação em tempo real através de divisões linguísticas.
A empresa disse em um blog que seu modelo SeamlessM4T poderia suportar traduções entre texto e fala em quase 100 idiomas, bem como tradução completa de fala para fala em 35 idiomas, combinando tecnologia que anteriormente estava disponível apenas em modelos separados.
O CEO Mark Zuckerberg disse que prevê tais ferramentas facilitando as interações entre usuários de todo o mundo no metaverso, o conjunto de mundos virtuais interconectados no qual ele aposta o futuro da empresa.
A Meta está disponibilizando o modelo ao público para uso não comercial, disse o blog.
A maior empresa de mídia social do mundo lançou uma série de modelos de IA, em sua maioria gratuitos, este ano, incluindo um grande modelo de linguagem chamado Llama, que representa um sério desafio aos modelos proprietários vendidos pela OpenAI, apoiada pela Microsoft, e pelo Google, da Alphabet.
Zuckerberg diz que um ecossistema aberto de IA funciona a favor da Meta, já que a empresa tem mais a ganhar com o crowdsourcing eficaz para a criação de ferramentas voltadas para o consumidor para suas plataformas sociais do que cobrando pelo acesso aos modelos.
No entanto, a Meta enfrenta questões jurídicas semelhantes às do resto da indústria em torno dos dados de treinamento ingeridos para criar seus modelos.
Em julho, a comediante Sarah Silverman e dois outros autores entraram com ações judiciais por violação de direitos autorais contra a Meta e a OpenAI, acusando as empresas de usarem seus livros como dados de treinamento sem permissão.
Para o modelo SeamlessM4T, os pesquisadores da Meta disseram em um artigo de pesquisa que coletaram dados de treinamento de áudio de 4 milhões de horas de “áudio bruto proveniente de um repositório publicamente disponível de dados rastreados da web”, sem especificar qual repositório.
Um porta-voz da Meta não respondeu às perguntas sobre a procedência dos dados de áudio.
Os dados de texto vieram de conjuntos de dados criados no ano passado que extraíram conteúdo da Wikipedia e de sites associados, disse o artigo de pesquisa.
©ThomsonReuters 2023
source – www.gadgets360.com