Mistral, a empresa de inteligência artificial (IA), com sede em Paris, lançou o modelo Mistral Small 3 AI na quinta-feira. A empresa, conhecida por seus grandes modelos de idiomas de código aberto (LLMS), também disponibilizou o mais recente modelo de IA em abraçar o rosto, além de várias outras plataformas. Mistral afirmou que o modelo mais recente foi construído com velocidade, eficiência e desempenho de processamento em mente, e pode superar os modelos do dobro do seu tamanho. Os testes internos da empresa de IA consideraram o modelo para oferecer melhor desempenho do que o GPT-4O Mini do OpenAI.
Mistral Mistral Small 3 AI modelo lançado
Em uma redação publicara empresa francesa de IA detalhou o novo modelo de IA. Mistral Small 3 é um modelo otimizado com latência com 24 bilhões de parâmetros. O LLM está sendo lançado com um ponto de verificação pré-treinado e ajustado para instruções para atender a uma ampla gama de tarefas. O modelo de IA está disponível sob a licença Apache 2.0 para uso acadêmico e comercial. Mistral destacou que está se afastando do modelo de licença de pesquisa Mistral (MRL) que apenas permite o uso acadêmico e relacionado à pesquisa.
A empresa afirmou que o modelo de IA não é treinado com o processo de aprendizado de reforço (RL) nem inclui dados sintéticos (dados gerados a partir de outros modelos de IA ou fontes digitais) no conjunto de dados de treinamento.
Com base em testes internos, a empresa de IA alegou que o Mistral Small 3 supera o GPT-4O Mini em termos de latência. Ele também teve um desempenho melhor do que o OpenAI LLM no enorme entendimento de idiomas multitarefa (MMLU) Pro e as principais referências de perguntas e respostas à prova de pós-graduação no Google (GPQA). Os desenvolvedores também revelaram que o modelo é competitivo com o modelo LLAMA 3.3 70B, apesar de ser três vezes menor.
De acordo com a empresa, esse modelo pode ser usado para casos de uso em que a eficiência ou a velocidade é importante para os desenvolvedores. Alguns dos casos de uso sugeridos incluem cenários em que a assistência conversacional de resposta rápida é crítica, cenários em que é importante cenários de função de baixa latência, ou cenários em que os desenvolvedores desejam criar um chatbot que seja o especialista no assunto, ajustando o LLM.
O modelo de IA também pode ser usado para organizações que preferem a inferência local para proteger dados sensíveis ou proprietários. Notavelmente, o Mistral Small 3 pode ser executado em particular em uma única GPU NVIDIA RTX 4090. Os desenvolvedores podem acessar o modelo a partir de seu rosto abraçando Listagem.
source – www.gadgets360.com