O Google adiciona seu modelo de voz HD Chirp 3 à sua plataforma Ai Vertex | TechCrunch

Muito do foco na IA generativa até agora tem sido em interfaces baseadas em texto usadas para gerar texto, imagens e muito mais. A próxima onda parece ser voz e está rolando rapidamente. No desenvolvimento mais recente, o Google anunciou hoje que estaria adicionando o Chirp 3 – sua interface de voz em HD – à sua plataforma de desenvolvimento da AI da Vertex a partir da próxima semana.

Na semana passada, o Google anunciou silenciosamente que o Chirp 3 estaria lançando 8 novas vozes para 31 idiomas. Os casos de uso da plataforma incluem a criação de assistentes de voz, a criação de audiolivros, o desenvolvimento de agentes de suporte e as dublagens para vídeos. A notícia foi anunciada em um evento nos escritórios DeepMind do Google em Londres.

Seus esforços estão chegando ao mesmo tempo em que outros também estão avançando com a voz da AI. Na semana passada, o gergelim – a startup por trás dos aplicativos virais e muito realistas de “Maya” e “Miles” AI – anunciou o lançamento de seu modelo para os desenvolvedores desenvolverem seus aplicativos e serviços personalizados em cima de sua tecnologia.

Notavelmente, haverá restrições de uso em torno do Chirp 3 para tentar acompanhar o uso indevido. “Estamos apenas trabalhando com algumas dessas coisas com nossa equipe de segurança”, disse Thomas Kurian, CEO do Google Cloud, em um evento de notícias hoje.

O Elevenlabs está entre as principais startups que levantaram centenas de milhões em financiamento para expandir seu trabalho nos serviços de voz da IA.

As notícias trarão o Chirp 3 para o mesmo estábulo que as versões mais recentes de seu principal LLM, Gemini, que estão sendo testadas, bem como seu modelo de geração de imagens Imagen e sua sensação de geração de vídeo VEO 2.

É discutível se o que o Google está lançando com o Chirp 3 será tão “realista” quanto alguns dos outros esforços da IA ​​para criar vozes “humanas” (o trabalho da Vila se destaca em particular). Mas, como enfatizou Demis Hassabis, CEO da Deepmind, isso continua sendo uma maratona, não um sprint.

“No curto prazo … essa ideia que [AI is] Uma bala de prata para tudo nos próximos dois anos, ainda não vejo isso acontecendo. Acho que ainda estamos a alguns anos, a anos de algo como Agi acontecendo ”, disse ele. “Isso vai mudar as coisas … na próxima década, então o médio a longo prazo. É um desses momentos interessantes no tempo. ”

O Google lançou o Vertex AI em 2021 como plataforma para os desenvolvedores criarem serviços de aprendizado de máquina na nuvem. Isso foi, é claro, bem antes da explosão de interesse na IA e especificamente IA generativa, que veio com o lançamento dos serviços GPT da OpenAI.

Desde então, a empresa está se inclinando para a AI da Vertex em parte, pois é reproduzido em outras empresas como Microsoft e Amazon Building Generative Tooling para desenvolvedores. Além de criar IA generativa no topo de Gemini, os desenvolvedores podem usar a IA do vértice para classificar dados, treinar modelos e configurar modelos de trem para produção. Será interessante se ele se move para expandir seu jardim murado para modelos além dos criados pelo próprio Google.

O Google cria serviços de voz “chirp” há anos, voltando a usar o nome como um nome de código para seus esforços iniciais para competir contra o serviço Alexa da Amazon.

source – techcrunch.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here