OpenAI lançou o recurso Advanced Voice Mode with Vision no ChatGPT na quinta-feira. O recurso, que permite ao chatbot de inteligência artificial (IA) acessar a câmera do smartphone para capturar informações visuais do entorno do usuário, estará disponível para todos os assinantes do ChatGPT Plus, Team e Pro. O recurso aproveita os recursos do GPT-4o e pode fornecer respostas de voz em tempo real sobre o que está sendo mostrado na câmera. A visão no ChatGPT foi revelada pela primeira vez em maio, durante o evento Spring Updates da empresa.
ChatGPT obtém recursos de visão
O novo recurso ChatGPT foi lançado no sexto dia do cronograma de lançamento de recursos de 12 dias da OpenAI. A empresa de IA lançou até agora a versão completa do modelo o1, o modelo Sora de geração de vídeo e uma nova ferramenta Canvas. Agora, com o modo Advanced Voice with Vision, os usuários podem permitir que a IA veja o que está ao seu redor e faça perguntas com base nele.
Numa demonstração, os membros da equipe OpenAI interagiram com o chatbot com a câmera ligada e apresentaram diversas pessoas. Depois disso, a IA poderia responder a um questionário sobre essas pessoas, mesmo quando elas não estivessem ativamente na tela. Isso destaca que o modo de visão também vem com memória, embora a empresa não tenha especificado quanto tempo dura a memória.
Os usuários podem usar o recurso de visão ChatGPT para mostrar sua geladeira à IA e pedir receitas ou mostrar seu guarda-roupa e pedir recomendações de roupas. Eles também podem mostrar à IA um ponto de referência externo e fazer perguntas sobre ele. Esse recurso é combinado com a baixa latência e o emotivo modo Advanced Voice do chatbot, facilitando a interação dos usuários em linguagem natural.
Assim que o recurso for implementado para os usuários, eles podem acessar o aplicativo móvel do ChatGPT e tocar no ícone Advanced Voice. Na nova interface, eles agora verão uma opção de vídeo, tocando que dará à IA acesso ao feed da câmera do usuário. Além disso, também está disponível um recurso de compartilhamento de tela que pode ser acessado tocando no menu de três pontos.
O recurso de compartilhamento de tela permitirá que a IA veja o dispositivo do usuário e qualquer aplicativo ou tela que ele acesse. Dessa forma, o chatbot também pode ajudar os usuários com questões e dúvidas relacionadas ao smartphone. Notavelmente, a OpenAI disse que todos os assinantes da equipe terão acesso ao recurso na próxima semana na versão mais recente do aplicativo móvel ChatGPT.
A maioria dos usuários Plus e Pro também terá o recurso, no entanto, os usuários na região da União Europeia, Suíça, Islândia, Noruega e Liechtenstein não o terão no momento. Por outro lado, os usuários Enterprise e Edu terão acesso ao Advanced Voice with Vision do ChatGPT no início de 2025.
source – www.gadgets360.com