O Google apresentou o sucessor da família Gemini 1.5 de modelos de IA, apelidada de Gemini 2.0, na quarta-feira. Os novos modelos de IA vêm com recursos aprimorados, incluindo suporte nativo para geração de imagem e geração de áudio, destacou a empresa. Atualmente, o modelo Gemini 2.0 está disponível em beta para desenvolvedores e testadores selecionados, enquanto o modelo Gemini 2.0 Flash AI foi adicionado aos aplicativos web e móveis do chatbot para todos os usuários. O Google disse que o modelo maior também será incluído em seus produtos em breve.
Modelos de IA do Google Gemini 2.0
Nove meses após o lançamento da série Gemini 1.5 de modelos de IA, o Google lançou agora a versão atualizada do modelo de linguagem grande (LLM). Em uma postagem no blog, a empresa anunciou que estava lançando o primeiro modelo da família Gemini 2.0 – uma versão experimental do Gemini 2.0 Flash. O modelo Flash geralmente contém menos parâmetros e não é adequado para tarefas complexas. No entanto, compensa com baixa latência e maior eficiência do que modelos maiores.
A gigante da tecnologia baseada em Mountain View destacou que o Gemini 2.0 Flash agora suporta saída multimodal, como geração de imagens com texto e áudio multilíngue de conversão de texto em fala (TTS) orientável. Além disso, o modelo de IA também está equipado com funções de agente. O Flash 2.0 chama nativamente ferramentas como a Pesquisa Google, ferramentas relacionadas à execução de código, bem como funções de terceiros, uma vez que o usuário as define por meio da API.
No que diz respeito ao desempenho, o Google compartilhou as pontuações de benchmark do Gemini 2.0 Flash com base em testes internos. Nos benchmarks Massive Multitask Language Understanding (MMLU), Natural2Code, MATH e Graduate-Level Google-Proof Q&A (GPQA), ele supera até mesmo o modelo Gemini 1.5 Pro.
Os usuários do Gemini podem selecionar o modelo experimental na opção de seletor de modelo localizada no canto superior esquerdo da web e na parte superior da interface do aplicativo móvel. Além disso, o modelo de IA também está disponível por meio da interface de programação de aplicativos (API) Gemini no Google AI Studio e Vertex AI. O modelo estará disponível para desenvolvedores com entrada multimodal e saída de texto. Atualmente, os recursos de imagem e conversão de texto em voz estão disponíveis apenas para parceiros de acesso antecipado do Google.
source – www.gadgets360.com