Saturday, May 18, 2024
HomeNotícias de criptomoedaMeta revela Audiocraft: ferramenta de IA que gera áudio e música a...

Meta revela Audiocraft: ferramenta de IA que gera áudio e música a partir de prompts de texto

Em uma tentativa de alcançar seus pares da Big Tech na corrida armamentista de IA, a Meta revelou uma série de ferramentas de IA, a mais recente das quais é o Audiocraft, uma ferramenta de IA que pode gerar áudio e música a partir de prompts de texto.

AudioCraft consiste em três modelos: MusicGen, AudioGen e EnCodec. O MusicGen foi treinado em cerca de 400.000 gravações junto com descrição de texto e metadados, totalizando 20.000 horas de música de propriedade da Meta ou licenciada especificamente para esta finalidade. Ele gera música a partir de prompts de texto, enquanto o AudioGen, que foi treinado em efeitos sonoros públicos, gera áudio a partir de prompts de texto.

Hoje, a Meta lançou uma versão aprimorada do decodificador EnCodec, que permite a geração de música de alta qualidade. Simultaneamente, a empresa está lançando seus modelos AudioGen pré-treinados, permitindo aos usuários criar uma variedade de sons ambientes e efeitos auditivos, como latidos de cachorro, buzinas de carros ou passos em superfícies de madeira. Além disso, a Meta está tornando o conjunto completo de pesos e códigos do modelo AudioCraft acessíveis ao público.

Esses modelos serão de código aberto, permitindo que pesquisadores e profissionais treinem seus próprios modelos com seus próprios conjuntos de dados. De acordo com a Meta, a família de modelos AudioCraft é capaz de fornecer áudio de alta qualidade, mantendo a facilidade de uso.

“Vemos a família de modelos AudioCraft como ferramentas para as caixas de ferramentas profissionais de músicos e designers de som, pois podem fornecer inspiração, ajudar as pessoas a fazer um brainstorming rápido e iterar em suas composições de novas maneiras.”

Meta escreveu em uma postagem no blog.

AudioCraft serve como uma plataforma unificada que engloba música, som, compressão e geração, tudo dentro de uma única estrutura. Indivíduos que desejam construir melhores geradores de som, algoritmos de compressão ou geradores de música podem fazê-lo dentro da mesma base de código, construindo sobre a base estabelecida por outros no campo.



source – mpost.io

Isenção de responsabilidade: Não somos consultores financeiros. Por favor, faça sua pesquisa antes de investir, nenhum jornalista da Asiafirstnews esteve envolvido na criação deste conteúdo. O grupo também não é responsável por este conteúdo.
Disclaimer: We are not financial advisors. Please do your research before investing, no Asiafirstnews journalists were involved in the creation of this content. The group is also not responsible for this content.

ARTIGOS RELACIONADOS

Mais popular