OpenAI anunciou que está lançando novos recursos de voz e imagem no ChatGPT para um tipo de interface mais intuitivo. Isso permitirá que os usuários tenham uma conversa por voz ou mostrem ao ChatGPT o que estão falando. Até agora, o ChatGPT está limitado apenas à forma de texto, onde você pode fornecer informações apenas na entrada de texto.
“Tire uma foto de um ponto de referência enquanto viaja e tenha uma conversa ao vivo sobre o que há de interessante nele”, disse o blog OpenAI.
OpenAI lançará a nova atualização nas próximas duas semanas para usuários ChatGPT plus e Enterprise. O recurso de voz estará disponível apenas em iOS e Android, enquanto as imagens estarão disponíveis em todas as plataformas.
Como iniciar uma conversa de voz no telefone
Passo 1: Para começar com a voz, vá para Configurações → Novos recursos no aplicativo móvel e opte por conversas de voz.
Passo 2: Em seguida, toque no botão do fone de ouvido localizado no canto superior direito da tela inicial e escolha sua voz preferida entre cinco vozes diferentes.
Etapa 3: O novo recurso de voz é alimentado por um novo modelo de conversão de texto em fala, capaz de gerar áudio semelhante ao humano a partir de apenas texto e alguns segundos de amostra de fala.
Passo 4: Colaboramos com dubladores profissionais para criar cada uma das vozes. Também usamos o Whisper, nosso sistema de reconhecimento de fala de código aberto, para transcrever suas palavras faladas em texto.
ChatGPT agora pode ver, ouvir e falar. Com lançamento nas próximas duas semanas, os usuários do Plus poderão ter conversas de voz com ChatGPT (iOS e Android) e incluir imagens nas conversas (todas as plataformas). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb – OpenAI (@OpenAI) 25 de setembro de 2023
Converse sobre imagens
Agora você pode mostrar ao ChatGPT uma ou mais imagens. Solucione o motivo pelo qual sua churrasqueira não liga, explore o conteúdo de sua geladeira para planejar uma refeição ou analise um gráfico complexo para obter dados relacionados ao trabalho. Para focar em uma parte específica da imagem, você pode usar a ferramenta de desenho em nosso aplicativo móvel.
Como iniciar a opção de imagem
Passo 1: para começar, toque no botão de foto para capturar ou escolher uma imagem. Se você estiver no iOS ou Android, toque primeiro no botão de adição.
Passo 2: Você também pode discutir várias imagens ou usar nossa ferramenta de desenho para orientar seu assistente.
Etapa 3: a compreensão da imagem é alimentada por GPT-3.5 e GPT-4 multimodais. Esses modelos aplicam suas habilidades de raciocínio linguístico a uma ampla variedade de imagens, como fotografias, capturas de tela e documentos contendo texto e imagens.
source – zeenews.india.com