O Google anunciou, nesta semana, uma nova funcionalidade para seu assistente de inteligência artificial, o Gemini, que permite a criação de músicas a partir de comandos simples. A empresa, que integra a holding Alphabet, divulgou a novidade em um post em seu blog oficial na quarta-feira (18).
A medida marca um passo significativo na corrida por ferramentas criativas baseadas em IA. Ela coloca a gigante da tecnologia em competição direta com outras empresas, como a Apple, que também estão adicionando recursos de inteligência artificial generativa focados em música em seus principais aplicativos de consumo.
Como funciona a criação musical com o Gemini
O assistente de IA Gemini do Google agora pode criar faixas musicais de 30 segundos a partir de texto, fotos ou vídeos enviados pelos usuários. Para isso, a empresa utiliza o modelo Lyria 3, desenvolvido pela Google DeepMind, que é responsável por processar os comandos e gerar o conteúdo sonoro.
Flexibilidade e disponibilidade
O recurso oferece flexibilidade, podendo gerar:
- Letras personalizadas
- Áudio puramente instrumental
Além disso, a ferramenta está disponível para pessoas com mais de 18 anos e suporta múltiplos idiomas, ampliando seu alcance global.
Plataformas de acesso
Inicialmente, a funcionalidade está sendo lançada na versão desktop do Gemini, com acesso direto pelo navegador. No entanto, a empresa já informou que o recurso aparecerá no aplicativo móvel nos próximos dias, permitindo que os usuários criem músicas também a partir de seus smartphones.
Essa expansão para dispositivos móveis deve tornar a ferramenta ainda mais acessível e conveniente para o público em geral.
Elementos visuais e salvaguardas da IA
Capas personalizadas
Para complementar a experiência musical, o Google integrou um modelo popular de criação de imagens, chamado Nano Banana, que gera capas personalizadas junto com a faixa. Essas capas adicionam um elemento visual quando os usuários compartilharem links das músicas com outras pessoas, enriquecendo a apresentação do conteúdo criado.
Dessa forma, a plataforma oferece uma solução completa, que vai desde a geração do áudio até a embalagem visual para compartilhamento.
Proteção de direitos autorais
Por outro lado, a empresa estabeleceu medidas para evitar problemas de direitos autorais. O Google afirmou no blog que possui salvaguardas que impedem a IA de copiar conteúdo de artistas específicos.
Se os usuários mencionarem músicos reais, o Gemini usará o prompt apenas como inspiração criativa ampla, criando uma faixa que compartilhe estilo ou humor semelhante, mas sem reproduzir obras protegidas. Essa abordagem busca equilibrar a criatividade com o respeito à propriedade intelectual.
Base de treinamento e implicações do modelo Lyria 3
O treinamento para o modelo Lyria 3 é projetado para usar músicas que o YouTube e o Google têm direito de utilizar, garantindo uma base legal para o desenvolvimento da inteligência artificial. Essa estratégia visa minimizar riscos legais e éticos, ao mesmo tempo em que fornece um vasto repertório para o aprendizado da máquina.
A medida reflete um cuidado crescente das grandes empresas de tecnologia com as fontes de dados utilizadas em seus sistemas de IA.
Concorrência no mercado de IA
A introdução desse recurso pelo Google ocorre em um momento de intensa competição no setor de inteligência artificial generativa. Com a Apple também investindo em ferramentas similares, o mercado de criação musical assistida por máquinas promete se tornar mais dinâmico nos próximos meses.
As duas gigantes tecnológicas parecem determinadas a conquistar espaço nesse novo nicho, oferecendo soluções que democratizam a produção de conteúdo artístico.
O futuro da criação musical com inteligência artificial
A capacidade de gerar músicas a partir de comandos simples representa uma evolução significativa nas ferramentas criativas disponíveis para o público geral. Ao permitir que usuários sem formação musical criem faixas completas, o Google está ampliando as possibilidades de expressão artística.
No entanto, a tecnologia também levanta questões sobre:
- Autoria
- Originalidade
- O futuro dos profissionais da música
Esses temas devem ganhar mais destaque à medida que essas ferramentas se popularizarem.
Implementação gradual e padrões do setor
Por enquanto, o foco da empresa está na implementação gradual do recurso, começando pela versão desktop e expandindo para dispositivos móveis em breve. A adoção de salvaguardas contra plágio e o uso de uma base de treinamento legalmente autorizada indicam uma abordagem cautelosa por parte do Google.
Esses cuidados podem servir como referência para outras empresas que desenvolvem tecnologias similares, estabelecendo padrões para o setor.