Friday, January 31, 2025
HomeSocial Media & InternetModelo de IA de código aberto pequeno 3 Mistral Introduzido, supera o...

Modelo de IA de código aberto pequeno 3 Mistral Introduzido, supera o GPT-4o Mini do OpenAI do OpenAI

Mistral, a empresa de inteligência artificial (IA), com sede em Paris, lançou o modelo Mistral Small 3 AI na quinta-feira. A empresa, conhecida por seus grandes modelos de idiomas de código aberto (LLMS), também disponibilizou o mais recente modelo de IA em abraçar o rosto, além de várias outras plataformas. Mistral afirmou que o modelo mais recente foi construído com velocidade, eficiência e desempenho de processamento em mente, e pode superar os modelos do dobro do seu tamanho. Os testes internos da empresa de IA consideraram o modelo para oferecer melhor desempenho do que o GPT-4O Mini do OpenAI.

Mistral Mistral Small 3 AI modelo lançado

Em uma redação publicara empresa francesa de IA detalhou o novo modelo de IA. Mistral Small 3 é um modelo otimizado com latência com 24 bilhões de parâmetros. O LLM está sendo lançado com um ponto de verificação pré-treinado e ajustado para instruções para atender a uma ampla gama de tarefas. O modelo de IA está disponível sob a licença Apache 2.0 para uso acadêmico e comercial. Mistral destacou que está se afastando do modelo de licença de pesquisa Mistral (MRL) que apenas permite o uso acadêmico e relacionado à pesquisa.

A empresa afirmou que o modelo de IA não é treinado com o processo de aprendizado de reforço (RL) nem inclui dados sintéticos (dados gerados a partir de outros modelos de IA ou fontes digitais) no conjunto de dados de treinamento.

Com base em testes internos, a empresa de IA alegou que o Mistral Small 3 supera o GPT-4O Mini em termos de latência. Ele também teve um desempenho melhor do que o OpenAI LLM no enorme entendimento de idiomas multitarefa (MMLU) Pro e as principais referências de perguntas e respostas à prova de pós-graduação no Google (GPQA). Os desenvolvedores também revelaram que o modelo é competitivo com o modelo LLAMA 3.3 70B, apesar de ser três vezes menor.

De acordo com a empresa, esse modelo pode ser usado para casos de uso em que a eficiência ou a velocidade é importante para os desenvolvedores. Alguns dos casos de uso sugeridos incluem cenários em que a assistência conversacional de resposta rápida é crítica, cenários em que é importante cenários de função de baixa latência, ou cenários em que os desenvolvedores desejam criar um chatbot que seja o especialista no assunto, ajustando o LLM.

O modelo de IA também pode ser usado para organizações que preferem a inferência local para proteger dados sensíveis ou proprietários. Notavelmente, o Mistral Small 3 pode ser executado em particular em uma única GPU NVIDIA RTX 4090. Os desenvolvedores podem acessar o modelo a partir de seu rosto abraçando Listagem.



source – www.gadgets360.com

Isenção de responsabilidade: Não somos consultores financeiros. Por favor, faça sua pesquisa antes de investir, nenhum jornalista da Asiafirstnews esteve envolvido na criação deste conteúdo. O grupo também não é responsável por este conteúdo.
Disclaimer: We are not financial advisors. Please do your research before investing, no Asiafirstnews journalists were involved in the creation of this content. The group is also not responsible for this content.

Sandy J
Sandy J
Hi thanks for visiting Asia First News, I am Sandy I will update the daily World and Music News Here, for any queries related to the articles please use the contact page to reach us. :-
ARTIGOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Mais popular