Principais conclusões
Após uma espera maior do que o esperado, Sam Altman da OpenAI indicou em uma resposta no X que os novos recursos de voz do GPT-4o finalmente começarão a ser lançados na semana que vem. No entanto, esta versão alfa será limitada a um pequeno conjunto de assinantes do ChatGPT Plus inicialmente, com os recursos provavelmente tendo um lançamento mais amplo em algum momento no outono.
Em maio, a OpenAI apresentou o GPT-4o, seu novo modelo. A demonstração incluiu alguns novos recursos impressionantes, como a capacidade de responder a informações de um feed de vídeo em tempo real e novos recursos de voz que fariam com que falar com o GPT-4o parecesse mais com falar com um humano. Quando o GPT-4o foi lançado, os recursos de voz estavam faltando, com mensagens no aplicativo indicando que os novos recursos do Modo de Voz seriam lançados em breve. Agora parece que o lançamento finalmente vai começar.
RelacionadoSearchGPT explicado: O que é e como você pode ser o primeiro a experimentá-lo
Há muito tempo há rumores de que a OpenAI está trabalhando em um concorrente para o Google Search, e agora ele finalmente chegou.
O GPT-4o Voice fará com que falar com o ChatGPT pareça muito mais natural
A voz será mais capaz e terá algumas habilidades adicionais
Mesmo antes do lançamento do GPT-4o, você já podia falar com o GPT-4 no Modo de Voz, mas uma das grandes desvantagens é que é difícil ter o que parece ser uma conversa natural quando há um atraso médio de 5,4 segundos. Você fala em voz alta e então tem que assistir à animação do balão de pensamento por alguns segundos antes de obter qualquer resposta.
O novo Modo de Voz do GPT-4o reduzirá o tempo médio de resposta para apenas 320 milissegundos e pode chegar a 232 milissegundos. Isso permite que você tenha o que parece ser uma conversa instantânea de ida e volta com o GPT-4o. Nas demonstrações durante o anúncio, as respostas foram impressionantemente rápidas. Também é possível interromper a resposta apenas falando novamente; a resposta de voz será interrompida e o GPT-4o começará a ouvir novamente.
Se as capacidades na natureza forem tão impressionantes quanto nas demonstrações, então falar com o GPT-4o realmente fará com que parecer que estamos falando com outra pessoa.
A velocidade não é a única mudança, no entanto. É possível fazer com que o GPT-4o fale em diferentes tons de voz ou de outras maneiras diferentes. Vídeos de demonstração mostram o GPT-4o falando em um tom de voz sarcástico, falando como um apresentador esportivo, contando até dez em velocidades diferentes e até mesmo cantando Parabéns a Você. Se as capacidades na natureza forem tão impressionantes quanto nas demonstrações, então isso realmente fará com que falar com o GPT-4o pareça falar com outra pessoa.
O Modo de Voz no GPT-4o também é capaz de tradução em tempo real. Por exemplo, é possível que uma pessoa fale com o GPT-4o em um idioma e uma segunda pessoa fale com o GPT-4o em um idioma diferente. O GPT-4o repetirá cada frase no idioma oposto, permitindo que duas pessoas que não falam o mesmo idioma mantenham uma conversa.
Você provavelmente terá que esperar um pouco mais pelo Modo de Voz GPT-4o
Os novos recursos estão sendo lançados apenas para um pequeno grupo de usuários do ChatGPT Plus
O lançamento inicial dos novos recursos demorou muito para chegar. A OpenAI declarou em maio que eles seriam lançados “nas próximas semanas”, mas o número de semanas desde o anúncio já atingiu dois dígitos. No entanto, a espera está quase no fim, para um pequeno punhado de pessoas, pelo menos. Assim como a confirmação de Sam Altman no X, a mensagem dentro do aplicativo ChatGPT também afirma que a Open AI “começará o alfa com um pequeno grupo de usuários Plus no final de julho”.
Este pequeno lançamento inicial significa que mesmo se você for um usuário do ChatGPT Plus, é altamente improvável que você tenha acesso aos novos recursos do Modo de Voz na próxima semana. No entanto, a mensagem também afirma que “o plano é que todos os usuários do Plus tenham acesso no outono”, então, esperançosamente, o resto de nós não terá muito mais tempo para esperar. Uma coisa é certa: quando o novo Modo de Voz for lançado, não vai soar nada como Scarlett Johansson.
source – www.pocket-lint.com