ChatGPT foi atualizado com suporte para conversas de voz e reconhecimento de imagem, anunciou a OpenAI na segunda-feira. O chatbot da empresa com tecnologia de IA em breve será capaz de compreender imagens capturadas ou compartilhadas pelos usuários e fornecer detalhes ou informações relacionadas nas plataformas onde o chatbot está disponível. Ele também será capaz de conversar usando a ferramenta de reconhecimento de fala Whisper da OpenAI e uma nova tecnologia de conversão de texto em fala (TTS) da empresa que afirma oferecer áudio “semelhante ao humano” no aplicativo ChatGPT da empresa para smartphones.
A OpenAI revelou em uma postagem no blog que o novo recurso de reconhecimento de imagem da empresa para ChatGPT estará disponível em todas as plataformas, enquanto o recurso de conversas por voz estará disponível em iOS e Android por meio de uma configuração opcional. Esses recursos estarão disponíveis para assinantes ChatGPT Plus e Enterprise, e não há informações se serão implementados para usuários no nível gratuito no futuro.
As conversas de voz que chegam ao ChatGPT podem ser habilitadas acessando Configurações > Novas características e alternando a opção para ativar conversas de voz. Você pode então selecionar entre cinco vozes – a OpenAI afirma que trabalhou com dubladores profissionais para oferecer o novo recurso. O aplicativo ChatGPT poderá responder perguntas convertendo suas dúvidas faladas em texto que possa ser compreendido pelo chatbot, e as respostas serão transformadas em áudio usando a nova tecnologia TTS da empresa.
ChatGPT não é o único serviço que usará a nova tecnologia TTS da OpenAI – o Spotify anunciou na segunda-feira uma nova ferramenta de tradução de voz baseada em IA para criadores de podcast que pode traduzir automaticamente um podcast do inglês para francês, alemão e espanhol. A ferramenta está sendo testada com alguns hosts de podcast e os episódios traduzidos estarão disponíveis para todos os usuários onde quer que o Spotify esteja disponível, de acordo com a plataforma de streaming.
OpenAI afirma que a nova ferramenta de reconhecimento de imagem funciona nos modelos multimodais GPT-3.5 e GPT-4 da empresa e é capaz de analisar imagens e textos contidos em fotografias, capturas de tela e documentos. Os usuários podem capturar uma imagem ou compartilhar uma imagem existente em seus telefones com ChatGPT para obter insights do chatbot.
O ChatGPT também permitirá que os usuários compartilhem múltiplas imagens que podem ser discutidas com o chatbot, de acordo com a OpenAI. Se você quiser focar em uma área específica, a ferramenta de desenho integrada permitirá marcar uma parte da imagem. Por exemplo, desenhar uma corrente de bicicleta desalojada em uma foto compartilhada com o ChatGPT pode permitir que o chatbot mostre maneiras de resolver o problema.
Acompanhe as novidades do Consumer Electronics Show no Gadgets 360, em nosso hub CES 2024.
source – www.gadgets360.com