Social Media & Internet Tecnologia Últimas notícias

Modelo de IA de código aberto pequeno 3 Mistral Introduzido, supera o GPT-4o Mini do OpenAI do OpenAI

January 31, 2025

14

Mistral, a empresa de inteligência artificial (IA), com sede em Paris, lançou o modelo Mistral Small 3 AI na quinta-feira. A empresa, conhecida por seus grandes modelos de idiomas de código aberto (LLMS), também disponibilizou o mais recente modelo de IA em abraçar o rosto, além de várias outras plataformas. Mistral afirmou que o modelo mais recente foi construído com velocidade, eficiência e desempenho de processamento em mente, e pode superar os modelos do dobro do seu tamanho. Os testes internos da empresa de IA consideraram o modelo para oferecer melhor desempenho do que o GPT-4O Mini do OpenAI.

Mistral Mistral Small 3 AI modelo lançado

Em uma redação publicara empresa francesa de IA detalhou o novo modelo de IA. Mistral Small 3 é um modelo otimizado com latência com 24 bilhões de parâmetros. O LLM está sendo lançado com um ponto de verificação pré-treinado e ajustado para instruções para atender a uma ampla gama de tarefas. O modelo de IA está disponível sob a licença Apache 2.0 para uso acadêmico e comercial. Mistral destacou que está se afastando do modelo de licença de pesquisa Mistral (MRL) que apenas permite o uso acadêmico e relacionado à pesquisa.

A empresa afirmou que o modelo de IA não é treinado com o processo de aprendizado de reforço (RL) nem inclui dados sintéticos (dados gerados a partir de outros modelos de IA ou fontes digitais) no conjunto de dados de treinamento.

Com base em testes internos, a empresa de IA alegou que o Mistral Small 3 supera o GPT-4O Mini em termos de latência. Ele também teve um desempenho melhor do que o OpenAI LLM no enorme entendimento de idiomas multitarefa (MMLU) Pro e as principais referências de perguntas e respostas à prova de pós-graduação no Google (GPQA). Os desenvolvedores também revelaram que o modelo é competitivo com o modelo LLAMA 3.3 70B, apesar de ser três vezes menor.

De acordo com a empresa, esse modelo pode ser usado para casos de uso em que a eficiência ou a velocidade é importante para os desenvolvedores. Alguns dos casos de uso sugeridos incluem cenários em que a assistência conversacional de resposta rápida é crítica, cenários em que é importante cenários de função de baixa latência, ou cenários em que os desenvolvedores desejam criar um chatbot que seja o especialista no assunto, ajustando o LLM.

O modelo de IA também pode ser usado para organizações que preferem a inferência local para proteger dados sensíveis ou proprietários. Notavelmente, o Mistral Small 3 pode ser executado em particular em uma única GPU NVIDIA RTX 4090. Os desenvolvedores podem acessar o modelo a partir de seu rosto abraçando Listagem.

source – www.gadgets360.com

Modelo de IA de código aberto pequeno 3 Mistral Introduzido, supera o GPT-4o Mini do OpenAI do OpenAI

Mistral Mistral Small 3 AI modelo lançado

O Dr. Desrespeto Midnight Society Studio é encerrado antes de lançar seu primeiro jogo

Meta está trabalhando horas extras para esmagar X, e sua estratégia pode estar funcionando

Os Rolling Stones supostamente descartam planos de turnê europeu

A Apple está no topo de 1 bilhão de assinaturas, quase US $ 100 bilhões em receita de serviços em 2024 | TechCrunch

Assista Joni Mitchell executar ‘Ambos os lados agora’ no show de benefício de La Fireaid

StableCoins superam o Visa e MasterCard com volume de transferência de US $ 27,6 trilhões em 2024

A Receita Trimestral da Intel é o topo das expectativas, pois os investidores aguardam um novo CEO

A adaptação de videogame de ação tão esperada pode ser ressuscitada pelo MCU Star

LEAVE A REPLY Cancel reply

Mais popular

O Dr. Desrespeto Midnight Society Studio é encerrado antes de lançar seu primeiro jogo

Meta está trabalhando horas extras para esmagar X, e sua estratégia pode estar funcionando

Os Rolling Stones supostamente descartam planos de turnê europeu

A Apple está no topo de 1 bilhão de assinaturas, quase US $ 100 bilhões em receita de serviços em 2024 | TechCrunch

Categorias populares