OpenAI adiciona geração de imagem ao GPT-4O, mas o nível gratuito terá que esperar

March 28, 2025

O OpenAI adicionou capacidade de geração de imagens ao seu modelo existente de inteligência artificial GPT-4O (AI) na terça-feira. A empresa de IA com sede em São Francisco lançou o modelo de geração de imagens 4O e o integrou ao GPT-4O. A empresa disse que o foco deste gerador de imagens está na utilidade em vez da decoratividade. Ele vem com renderização precisa de texto, alta adesão imediata, consistência do personagem e oferece capacidade de edição de imagens por meio de avisos de texto. O OpenAI também tomou várias medidas para mitigar o risco de deepfakes e a geração de conteúdo nocivo.

ChatGpt obtém capacidade aprimorada de geração de imagens

Mesmo antes dessa nova adição, o ChatGPT poderia gerar imagens alimentadas por um dos modelos Dall-E. No entanto, essa foi uma experiência básica de geração de imagem, onde a consistência do personagem e a geração de texto eram sub-par. Em uma postagem no blog, a empresa explicou que agora pretende adicionar a função de geração de imagem como uma capacidade primária dos modelos de linguagem.

Imagem gerada usando GPT-4O Crédito da foto: OpenAI

Isso significa que os grandes modelos de idiomas da empresa (LLMS) agora poderão gerar inerentemente imagens e fazer edições para gerar saídas. Devido ao grande tamanho do parâmetro desses modelos e aos esforços pós-treinamento, esses modelos são adequados para entender o contexto por trás dos avisos do usuário para fornecer exatamente o que estão procurando. Além disso, como esses são modelos de idiomas, eles podem processar e renderizar melhor o texto com precisão.

O novo gerador de imagens foi treinado na distribuição conjunta de imagens e texto on -line. O OpenAI afirma que o modelo entende como as imagens se relacionam com a linguagem e como as imagens se relacionam com outras imagens. Como resultado, agora vem com consistência aprimorada de caracteres, e os usuários podem gerar várias imagens com o mesmo personagem sem muito vago.

Imagens com texto gerado usando GPT 4OCrédito da foto: Openai/Derya Unatmaz e Les Morgan

Além disso, ele também pode gerar imagens com um grande volume de texto preciso. Isso significa que ele pode gerar com precisão imagens com placas, menus de restaurantes e texto escrito em um quadro branco. Os usuários também podem compartilhar uma imagem como entrada, e o chatbot pode recriá -la em diferentes estilos e fazer edições.

O ChatGPT também oferecerá geração de várias turnos com o mais recente gerador de imagens. Os usuários poderão solicitar ao AI Chatbot que faça alterações e adições a uma imagem gerada com prompts e pode refinar a saída sem alterar outros elementos. O Openai alegou que o modelo pode lidar com até 10 a 20 objetos diferentes em uma única imagem e adicionar esses elementos com precisão.

Imagem fotorrealista gerada usando GPT-4OCrédito da foto: OpenAI

Atualmente, esses recursos estão disponíveis para assinantes ChatGPT Plus, Team e Pro. Embora também estivesse disponível inicialmente para o nível gratuito, o CEO da Openai, Sam Altman, afirmou em um post em X (anteriormente conhecido como Twitter) que, devido ao alto volume de solicitação, o lançamento para a camada gratuito está sendo atrasado indefinidamente.

Notavelmente, vários usuários adotaram plataformas de mídia social para compartilhar recriações no estilo Ghibli de suas imagens e memes populares gerados usando o GPT-4O. Altman também mudou sua foto de perfil em X para uma versão no estilo Ghibli de sua imagem. Ghibli também estava tendendo globalmente na plataforma social.

Chegando à segurança, o OpenAI está adicionando informações de coalizão para proveniência e autenticidade de conteúdo (C2PA) nos metadados de todas as imagens geradas pela IA, para que possam ser facilmente distinguidas de imagens autênticas. A empresa de IA também criou uma ferramenta de pesquisa interna que pode verificar se uma imagem foi gerada pelo modelo da empresa.

Além disso, a empresa bloqueia os pedidos de imagens que incluem conteúdo nocivo, como material de abuso sexual infantil e fagos sexuais. Além disso, quando os usuários estão editando imagens de pessoas reais, a empresa adicionou restrições ao tipo de imagem que pode ser criada.

source – www.gadgets360.com

ChatGpt obtém capacidade aprimorada de geração de imagens

RELATED ARTICLESMORE FROM AUTHOR

Fé ‘The King of Kings’, ‘The escolhido’ com Hatsune Miku Anime, ‘Orgulho e Preconceito’ Relande o fim de semana de Páscoa de Páscoa Indie-Bilheteria...

Consoliads lança o imersivo ADS ™ ️: O futuro da publicidade de jogos para celular

O Codex CLI do OpenAI pode escrever e editar o código em seu terminal

LEAVE A REPLY Cancel reply

RELATED ARTICLES MORE FROM AUTHOR