O Google anunciou uma atualização significativa para Gemini, seu modelo interno de inteligência artificial (IA), na quarta-feira. A empresa anunciou que a capacidade de geração de imagens do chatbot agora será gerenciada pelo modelo Imagen 3 AI para todos os usuários. Imagen 3 é o modelo de geração de imagens mais recente e mais capaz da gigante da tecnologia baseada em Mountain View. Além do aplicativo Gemini, o recurso também está sendo estendido para a versão API do Gemini para permitir que os desenvolvedores criem aplicativos e experiências com base nesse recurso.
Usuários Gemini obtêm acesso ao modelo Imagen 3 AI
Em uma postagem no X (anteriormente conhecido como Twitter), o identificador oficial do aplicativo Google Gemini revelou que todos os usuários, inclusive os do nível gratuito, poderão gerar imagens usando o Imagen 3. A postagem destacou que o modelo de IA oferece um alto grau de fotorrealismo, melhor aderência imediata e adiciona menos elementos indesejados às imagens.
Os membros da equipe do Gadgets 360 conseguiram verificar se o aplicativo Gemini está de fato usando o Imagen 3 para gerar imagens. Para testar suas capacidades e compará-lo com o Meta AI, demos a mesma solicitação a ambos os chatbots. A sugestão era: “Desenhe a imagem de um cachorro golden retriever sentado no beliche de um trem, olhando para os Alpes pela janela. O trem tem interior de madeira e os assentos são verdes. Todos os outros passageiros do trem também são animais. Um condutor humano está verificando as passagens.”
As imagens geradas podem ser vistas acima. Embora ambos os modelos de IA não tenham incorporado um ou mais elementos instruídos no prompt, o Gemini conseguiu incorporar mais elementos. Além disso, enquanto o Meta AI gera imagens com resolução de 1280 x 1280, as imagens do Imagen 3 são geradas com resolução de 2048 x 2048.
Imagen 3 pode gerar imagens em uma ampla variedade de estilos, como fotorrealistas, pinturas a óleo texturizadas e cenas de argila. Os usuários também podem solicitar que as imagens apareçam como se tivessem sido tiradas de uma câmera específica, como uma Nikon DSLR, estilo GoPro, lente grande angular e muito mais.
O Google disse que o modelo de IA vem com salvaguardas integradas para reduzir o risco de deepfakes. Cada imagem gerada também vem com marca d’água SynthID, uma tecnologia que adiciona um rótulo de IA invisível aos pixels da imagem. Ele não pode ser cortado ou removido e está presente até mesmo nas capturas de tela.
source – www.gadgets360.com