A Meta lançou um novo modelo de linguagem grande chamado LLaMA (Large Language Model Meta AI) para apoiar os pesquisadores de IA. O modelo permitirá que mais pessoas na comunidade de pesquisa estudem modelos de linguagem e facilite o acesso a esse importante campo.
O LLaMA está disponível em vários tamanhos (parâmetros 7B, 13B, 33B e 65B). Ao treinar modelos de fundação menores, como o LLaMA, os pesquisadores podem usar menos poder de computação e recursos para testar novas abordagens e explorar novos casos de uso. Meta escreveu que o LLaMA é ideal para ajustar uma variedade de tarefas, pois treina em um grande conjunto de dados não rotulados. A Meta afirma estar comprometida com práticas responsáveis de IA e compartilha um cartão de modelo LLAMA que detalha como o modelo foi construído.
Para desenvolver o LLaMA, a Meta selecionou textos das 20 línguas mais faladas, com foco nas línguas que utilizam os alfabetos latino e cirílico. Este grande modelo de linguagem gera texto tomando uma sequência de palavras como entrada e prevendo a próxima palavra recursivamente, semelhante a outros modelos nesta categoria.
“Como modelo básico, o LLaMA foi projetado para ser versátil e pode ser aplicado a muitos casos de uso diferentes, em comparação com um modelo ajustado para uma tarefa específica. Ao compartilhar o código do LLaMA, outros pesquisadores podem testar com mais facilidade novas abordagens para limitar ou eliminar esses problemas em grandes modelos de linguagem,”
Meta escreveu.
A empresa admite que ainda precisa lidar com os riscos de preconceito, comentários tóxicos e alucinações em grandes modelos de linguagem, incluindo o LLaMA.
A Meta está lançando o modelo sob uma licença não comercial focada em casos de uso de pesquisa “para manter a integridade e evitar o uso indevido”. Indivíduos e organizações que buscam acesso ao modelo serão avaliados caso a caso. As partes elegíveis incluem pesquisadores acadêmicos, organizações governamentais e da sociedade civil e laboratórios de pesquisa da indústria em todo o mundo.
Você pode ler um artigo completo sobre o LLaMA aqui. Se elegível, você também pode se inscrever para testar o modelo de idioma.
Consulte Mais informação:
source – mpost.io