A Meta Platforms usou postagens públicas do Facebook e Instagram para treinar partes de seu novo assistente virtual Meta AI, mas excluiu postagens privadas compartilhadas apenas com familiares e amigos em um esforço para respeitar a privacidade dos consumidores, disse o principal executivo de políticas da empresa à Reuters em entrevista.
A Meta também não usou bate-papos privados em seus serviços de mensagens como dados de treinamento para o modelo e tomou medidas para filtrar detalhes privados de conjuntos de dados públicos usados para treinamento, disse o presidente de assuntos globais da Meta, Nick Clegg, falando à margem da conferência anual Connect da empresa. essa semana.
“Tentamos excluir conjuntos de dados que têm uma grande preponderância de informações pessoais”, disse Clegg, acrescentando que a “grande maioria” dos dados usados pelo Meta para treinamento estava disponível publicamente.
Ele citou o LinkedIn como exemplo de site cujo conteúdo a Meta deliberadamente optou por não usar por questões de privacidade.
Os comentários de Clegg ocorrem no momento em que empresas de tecnologia, incluindo Meta, OpenAI e Google, da Alphabet, são criticadas por usar informações coletadas da Internet sem permissão para treinar seus modelos de IA, que ingerem grandes quantidades de dados para resumir informações e gerar imagens.
As empresas estão a ponderar como lidar com os materiais privados ou protegidos por direitos de autor aspirados nesse processo e que os seus sistemas de IA podem reproduzir, ao mesmo tempo que enfrentam processos judiciais de autores que os acusam de infringir direitos de autor.
Meta AI foi o produto mais significativo entre as primeiras ferramentas de IA voltadas para o consumidor da empresa, reveladas pelo CEO Mark Zuckerberg na quarta-feira na conferência anual de produtos da Meta, Connect. O evento deste ano foi dominado por conversas sobre inteligência artificial, ao contrário de conferências anteriores que se concentraram em realidade aumentada e virtual.
Meta fez o assistente usando um modelo personalizado baseado no poderoso modelo de linguagem grande Llama 2 que a empresa lançou para uso comercial público em julho, bem como um novo modelo chamado Emu que gera imagens em resposta a solicitações de texto, disse.
O produto será capaz de gerar texto, áudio e imagens e terá acesso a informações em tempo real por meio de parceria com o buscador Bing, da Microsoft.
As postagens públicas do Facebook e Instagram usadas para treinar Meta AI incluíam texto e fotos, disse Clegg.
Essas postagens foram usadas para treinar o Emu para os elementos de geração de imagem do produto, enquanto as funções de bate-papo foram baseadas no Llama 2 com alguns conjuntos de dados anotados e disponíveis publicamente adicionados, disse um porta-voz da Meta à Reuters.
As interações com Meta AI também podem ser usadas para melhorar os recursos daqui para frente, disse o porta-voz.
Clegg disse que a Meta impôs restrições de segurança sobre o conteúdo que a ferramenta Meta AI poderia gerar, como a proibição da criação de imagens fotorrealistas de figuras públicas.
Sobre materiais protegidos por direitos autorais, Clegg disse que esperava uma “quantidade razoável de litígios” sobre a questão de “se o conteúdo criativo é coberto ou não pela doutrina existente de uso justo”, que permite o uso limitado de obras protegidas para fins como comentários, pesquisa e paródia.
“Achamos que sim, mas suspeito fortemente que isso acontecerá em litígios”, disse Clegg.
Algumas empresas com ferramentas de geração de imagens facilitam a reprodução de personagens icônicos como Mickey Mouse, enquanto outras pagaram pelos materiais ou evitaram deliberadamente incluí-los nos dados de treinamento.
A OpenAI, por exemplo, assinou um contrato de seis anos com o provedor de conteúdo Shutterstock neste verão para usar as bibliotecas de imagens, vídeos e músicas da empresa para treinamento.
Questionado se a Meta tomou alguma medida para evitar a reprodução de imagens protegidas por direitos autorais, um porta-voz da Meta apontou novos termos de serviço que proíbem os usuários de gerar conteúdo que viole a privacidade e os direitos de propriedade intelectual.
©ThomsonReuters 2023
source – www.gadgets360.com