A Meta Platforms apresentou na quarta-feira sua ferramenta AI de código aberto chamada AudioCraft, que ajudará os usuários a criar música e áudio com base em prompts de texto.
A ferramenta AI vem com três modelos, AudioGen, EnCodec e MusicGen, e funciona para música, som, compressão e geração, Meta disse.
MusicGen é treinado usando música de propriedade da empresa e especificamente licenciada, acrescentou.
Artistas e especialistas do setor levantaram preocupações sobre violações de direitos autorais, já que o software de aprendizado de máquina funciona reconhecendo e replicando padrões de dados extraídos da web.
De acordo com a postagem no blog da empresa, o MusicGen gera música a partir de prompts de texto, enquanto o AudioGen gera áudio a partir de prompts de texto. Meta também lançou uma versão melhorada do nosso decodificador EnCodec. Ajuda a gerar música de maior qualidade com menos artefatos. Os modelos AudioGen pré-treinados, anunciados pela empresa, permitem que os usuários gerem sons ambientais e efeitos sonoros. Ajuda a gerar sons como o latido de um cachorro ou sirenes de veículos.
Os modelos estarão disponíveis para acesso de pesquisadores e profissionais para treinar seus modelos com seus próprios conjuntos de dados. Esses modelos são capazes de produzir áudio de alta qualidade com consistência de longo prazo, afirma a empresa. Eles foram desenvolvidos internamente na Meta nos últimos anos.
Os modelos AudioCraft atuarão como ferramentas para músicos e designers de som no futuro, disse a empresa. A empresa também está trabalhando para melhorar os modelos atuais e adicionar improvisações com base no feedback dos usuários.
No início deste ano, a Alphabet apresentou sua própria ferramenta experimental de IA de geração de áudio chamada MusicLM.
source – www.gadgets360.com