Em resposta à pressão de rivais, incluindo a empresa de IA chinesa Deepseek, o Openai está mudando a maneira como seu mais novo modelo de IA, O3-mini, comunica seu processo passo a passo de “pensamento”.
Na quinta-feira, o OpenAI anunciou que os usuários gratuitos e pagos do ChatGPT, a plataforma de chatbot de IA da empresa, verá uma “cadeia de pensamento” atualizada que mostra mais etapas de “raciocínio” do modelo e como chegou às respostas às perguntas. Os assinantes de planos de chatgpt premium que usam O3-mini na configuração de “alto raciocínio” também verão essa leitura atualizada, de acordo com o OpenAI.
“Estamos apresentando um atualizado [chain of thought] Para a O3-mini, projetado para facilitar a compreensão das pessoas como o modelo pensa ”, disse um porta-voz do Openai ao Techcruch por e-mail. “Com esta atualização, você poderá seguir o raciocínio do modelo, dando a você mais clareza e confiança em suas respostas”.
Créditos da imagem:Openai
Modelos de raciocínio como O3-mini-Mini-Fact-se checam-se antes de fornecer resultados, o que os ajuda a evitar algumas das armadilhas que normalmente disparam modelos. A troca é que os modelos de raciocínio demoram um pouco mais para chegar a soluções-normalmente segundos a minutos mais.
O modelo R1 da Deepseek, um modelo de “raciocínio” na linha de O3-mini, revela seu processo de pensamento completo, que muitos pesquisadores de IA argumentam que é a abordagem preferida. Além de facilitar o estudo do modelo, as etapas de raciocínio proporcionam uma melhor experiência do usuário em determinadas situações, ajudando a indicar quando o modelo pode estar à direita – ou errada – rastrear.
O Openai optou por não mostrar as etapas completas de raciocínio para a O3-mini e seus antecessores, O1 e O1-Mini, em parte por razões competitivas. Em vez disso, os usuários viram apenas resumos das etapas de raciocínio – resumos que às vezes eram errôneos.
Quando informamos as pessoas em 🍓 antes do lançamento de O1-Preview, ver o Live Live era geralmente o momento “AHA” para elas que deixava claro que isso seria um grande negócio. Esses não são os berços crus, mas é um grande passo mais perto e estou feliz por podermos compartilhar essa experiência com o mundo. https://t.co/72zpprhmfk
– Noam Brown (@polynoamial) 6 de fevereiro de 2025
O Openai ainda não está mostrando as etapas completas de raciocínio da O3-Mini, mas a empresa disse que “encontrou um equilíbrio”: a O3-mini pode “pensar livremente” e depois organizar seus “pensamentos” em resumos mais detalhados.
“Para melhorar a clareza e a segurança, adicionamos uma etapa adicional de pós-processamento, onde o modelo analisa a cadeia bruta de pensamento, removendo qualquer conteúdo inseguro e, em seguida, simplifica quaisquer idéias complexas”, continuou o porta-voz do Openai. “Além disso, esta etapa de pós-processamento permite que os usuários não ingleses recebam a cadeia de pensamento em seu idioma nativo, criando uma experiência mais acessível e amigável”.
Em uma AMA do Reddit na semana passada, Kevin Weil, diretor de produtos da Openai, deu a entender que a mudança estava chegando.
“Estamos trabalhando para mostrar um monte mais do que mostramos hoje – [showing the model thought process] será muito, muito em breve ”, disse ele. “TBD em tudo – mostrando toda a cadeia de pensamento leva à destilação competitiva, mas também sabemos que as pessoas (pelo menos usuários de energia) querem, então encontraremos o caminho certo para equilibrá -lo.”
O TechCrunch tem um boletim informativo focado na IA! Inscreva -se aqui para obtê -lo em sua caixa de entrada toda quarta -feira.
source – techcrunch.com