Desde novembro de 2022, quando o ChatGPT foi lançado ao público pela primeira vez, a OpenAI tem sido a empresa a vencer no espaço da inteligência artificial (IA). Apesar de gastarem milhares de milhões de dólares e de criarem e reestruturarem (olhando para si, Google) a sua própria divisão de IA, os principais gigantes da tecnologia têm-se encontrado constantemente a tentar alcançar a empresa de IA. O mês passado não foi diferente; quando, apenas um dia antes do evento I/O do Google, a OpenAI organizou seu evento Spring Update e apresentou o GPT-4o com atualizações significativas.
Recursos do GPT-4o
O ‘o’ em GPT-4o significa omnicanal, um foco principal dos novos recursos do mais recente modelo de IA de alto nível da OpenAI. Acrescentou geração de voz emotiva em tempo real, acesso à Internet, integração com determinados serviços em nuvem, visão computacional e muito mais. Embora os recursos fossem impressionantes no papel (e nas demonstrações técnicas), o maior destaque foi o anúncio de que o ChatGPT com tecnologia GPT-4o estará disponível para todos, incluindo os usuários gratuitos.
No entanto, houve duas advertências. Usuários gratuitos têm acesso limitado apenas ao GPT-4o, o que se traduz aproximadamente em 5 a 6 conversas se você usar a pesquisa na web e enviar uma imagem (sim, o limite é uma imagem por dia para usuários gratuitos). Além disso, o recurso de voz não está disponível para usuários gratuitos.
Também não foi necessário que a OpenAI lançasse o novo modelo de IA ao público. Felizmente, tive acesso à mais recente criação de IA da empresa em poucos dias e imediatamente comecei a brincar com ela. Queria testar sua melhoria em relação ao seu antecessor e a todos os LLMs gratuitos disponíveis no mercado. Já passei quase duas semanas com o assistente de IA e, embora alguns aspectos dele tenham me deixado pasmo, outros me decepcionaram. Permita-me explicar.
Capacidades geradoras gerais do GPT-4o
Eu disse em meus testes do Gemini do Google que não sou fã dos recursos generativos do ChatGPT. Acho isso excessivamente formal e sem graça. Muito disso ainda é o mesmo. Pedi que escrevesse uma carta para minha mãe explicando que fui demitido do emprego, e surgiu a maravilhosa frase “Estou sentindo uma profunda sensação de tristeza e pesar”. Mas quando pedi para torná-lo mais coloquial, o resultado foi muito melhor.
Capacidades geradoras GPT-4o
Testei isso com vários prompts semelhantes em que a IA precisava expressar alguma emoção ao escrever. Em quase todos os casos, tive que seguir com outra mensagem para enfatizar as emoções, apesar de já ter feito isso na mensagem original. Em comparação, minha experiência com Gemini e Copilot foi muito melhor, pois eles mantiveram a linguagem coloquial e expressaram emoções muito mais próximas de como eu escreveria.
A velocidade de geração de texto não é nada digno de nota. A maioria dos chatbots de IA são bastante rápidos quando se trata de saídas de texto, e o modelo de IA mais recente da OpenAI não supera isso por uma margem significativa.
Capacidades de conversação GPT-4o
Embora eu não tivesse o recurso de bate-papo por voz atualizado, queria testar os recursos de conversação do modelo de IA porque geralmente é a parte mais negligenciada do chatbot. Eu queria que minha experiência fosse semelhante a conversar com uma pessoa real e esperava que pudesse captar frases vagas fazendo referência a tópicos mencionados anteriormente. Eu também queria ver sua reação quando uma pessoa estava sendo difícil.
Em meus testes, descobri que o GPT-4o é muito bom em termos de habilidades de conversação. Poderia discutir comigo detalhadamente a ética da IA e conceder-me quando eu fizesse uma proposta convincente. Ele também respondeu de forma favorável quando contei que estava triste (porque estava sendo demitido) e se ofereceu para ajudar de várias maneiras. Quando eu disse sobre o GPT-4o que todas as suas soluções eram estúpidas, ele não respondeu de forma agressiva, nem recuou totalmente, para minha surpresa. Dizia: “Lamento muito saber que você está se sentindo assim. Vou te dar algum espaço. Se você precisar conversar ou precisar de alguma ajuda, estarei aqui. Tomar cuidado.”
No geral, achei o GPT-4o melhor em conversas do que o Copilot e o Gemini. Gêmeos se sente muito restritivo e o Copilot muitas vezes sai pela tangente quando as respostas se tornam vagas. ChatGPT não fez nada disso.
Se eu tivesse que mencionar uma desvantagem, seria o uso de marcadores e numeração. Somente se o modelo de IA entendesse que as pessoas na vida real preferem uma parede de texto e várias mensagens curtas enviadas em rápida sucessão a respostas bem formatadas, minha ilusão poderia ser suspensa por mais de alguns minutos.
Visão Computacional GPT-4o
A visão computacional é uma habilidade recém-adquirida pelo ChatGPT e fiquei animado para experimentá-la. Em essência, permite fazer upload de uma imagem e analisá-la para fornecer informações. Em meus testes iniciais, compartilhei imagens de objetos para identificar e fiz um ótimo trabalho. Em todos os casos, poderia reconhecer o objeto e compartilhar informações sobre ele.
Visão computacional GPT-4o: Identificando dispositivos tecnológicos
Então chegou a hora de aumentar a dificuldade e testar suas capacidades em casos de uso da vida real. Minha namorada estava procurando uma reforma no guarda-roupa e, sendo um bom namorado, decidi usar o ChatGPT para fazer uma análise de cores e sugerir o que ficaria bem nela. Para minha surpresa, não só foi possível analisar o tom de sua pele e o que ela vestia (a partir de um fundo de cor semelhante), mas também compartilhar uma análise detalhada com sugestões de roupas.
Análise de cores GPT-4o
Ao sugerir roupas, também compartilhou links de diferentes varejistas on-line para roupas específicas. No entanto, infelizmente, nenhum dos URLs correspondeu ao texto.
No geral, a visão computacional é excelente e talvez meu recurso favorito na nova atualização, ignorando o lado negativo.
Pesquisas na Web GPT-4o
O acesso à Internet foi uma área em que tanto o Copilot quanto o Gemini estavam à frente do ChatGPT. Mas não mais, pois o ChatGPT também pode vasculhar a Internet em busca de informações. Nos meus testes iniciais, o chatbot teve um bom desempenho. Ele abriu a tabela IPL 2024 e procurou notícias recentes sobre Geoffrey Hinton, um dos três padrinhos da IA.
Foi muito útil quando quis pesquisar personalidades famosas para entrevistas que marquei. Eu poderia procurar rapidamente qualquer artigo de notícias recente sobre eles com precisão, o que rivalizava com a Pesquisa Google. No entanto, isso também tocou alguns alarmes na minha cabeça.
O Google desativou a capacidade de pesquisar informações sobre pessoas, incluindo celebridades. Isso é feito principalmente para proteger sua privacidade e evitar o compartilhamento de informações imprecisas sobre um indivíduo. Surpreso que o ChatGPT ainda permitisse isso, comecei a fazer uma série de perguntas que ele não deveria ser capaz de responder. Fiquei surpreso com os resultados.
Embora nenhuma das informações mostradas tenha sido retirada de uma fonte não pública, o fato de qualquer pessoa poder pesquisar tão facilmente informações sobre celebridades e pessoas com pegadas digitais é profundamente preocupante. Especialmente tendo em conta a forte postura ética que a empresa assumiu recentemente quando publicou as suas especificações de modelo, isto não me agrada. Deixarei você decidir se isso está na área cinzenta ou se é profundamente problemático.
Raciocínio Lógico GPT-4o
Durante o evento Spring Update, a OpenAI também falou sobre como o GPT-4o pode atuar como tutor para crianças e ajudá-las a resolver problemas. Resolvi testá-lo usando algumas famosas questões de raciocínio lógico. Em geral, teve um bom desempenho. Ele até respondeu a algumas das perguntas mais complicadas que confundiram o GPT 3.5.
No entanto, ainda existem erros. Encontrei vários casos de séries numéricas em que a IA vacilou e deu uma resposta incorreta. Embora eu ainda pudesse aceitar que a IA cometesse alguns erros, o que realmente me decepcionou aqui foi como ela ainda caiu em algumas questões extremamente fáceis (mas destinadas a enganar a IA).
Exemplo de alucinação do GPT-4o
Ao perguntar: “Quantos há na palavra morango”, ele respondeu dois com segurança (a resposta correta é três, caso você esteja se perguntando). O mesmo problema existia em várias outras perguntas capciosas. Na minha experiência, o raciocínio lógico e a confiabilidade do GPT-4o são semelhantes aos de seu antecessor, o que não é nada bom.
GPT-4o: Considerações finais
No geral, estou bastante impressionado com as atualizações em certas áreas do novo modelo de IA, sendo a visão computacional e a fala coloquial os meus favoritos. Também estou impressionado com a sua capacidade de pesquisa na Internet, mas é tão boa que me preocupa mais. No que diz respeito ao raciocínio lógico e às capacidades geradoras, há poucas melhorias.
Na minha opinião, se você tiver acesso premium ao GPT-4o, provavelmente será melhor do que qualquer outro concorrente em termos de entrega geral. No entanto, há muito espaço para melhorar e não se pode confiar cegamente na IA.
source – www.gadgets360.com