Sistem AI baru yang mengesankan dari Google dapat menghasilkan musik dalam genre apa pun dengan deskripsi teks. Tetapi perusahaan, karena takut akan risikonya, tidak memiliki rencana segera untuk merilisnya.
Disebut MusicLM, Google jelas bukan sistem AI generatif pertama untuk lagu. Ada upaya lain, termasuk Riffusion, AI yang menggubah musik dengan memvisualisasikannya, serta Dance Diffusion, AudioML milik Google dan Jukebox milik OpenAI. Tetapi karena keterbatasan teknis dan data pelatihan yang terbatas, tidak ada yang mampu menghasilkan lagu-lagu yang sangat rumit dalam komposisi atau fidelitas tinggi.
MusicLM mungkin yang pertama yang bisa.
Dirinci dalam sebuah makalah akademis, MusicLM dilatih pada dataset 280.000 jam musik untuk belajar menghasilkan lagu yang koheren untuk deskripsi — seperti yang dikatakan pembuatnya — “kompleksitas yang signifikan” (mis. penyanyi solo” atau “techno Berlin tahun 90-an dengan bass rendah dan tendangan yang kuat.” Lagu-lagunya, luar biasa, terdengar seperti karya seniman manusia, meskipun tidak terlalu inventif atau kohesif secara musik.
Sulit untuk melebih-lebihkan bagaimana bagus sampel terdengar, mengingat tidak ada musisi atau instrumentalis dalam loop. Bahkan ketika diberi deskripsi yang agak panjang dan berkelok-kelok, MusicLM berhasil menangkap nuansa seperti riff instrumental, melodi, dan suasana hati.
Judul untuk contoh di bawah ini, misalnya, menyertakan sedikit “menginduksi pengalaman tersesat di luar angkasa”, dan tentu saja disampaikan di bagian depan itu (setidaknya di telinga saya):
Ini contoh lain, yang dibuat dari deskripsi yang dimulai dengan kalimat “The main soundtrack of an arcade game”. Masuk akal, bukan?
Kemampuan MusicLM melampaui pembuatan klip lagu pendek. Peneliti Google menunjukkan bahwa sistem dapat membangun melodi yang ada, baik yang dinyanyikan, dinyanyikan, disiulkan, atau dimainkan pada instrumen. Selain itu, MusicLM dapat mengambil beberapa deskripsi yang ditulis secara berurutan (misalnya “waktu untuk bermeditasi”, “waktu untuk bangun”, “waktu untuk berlari”, “waktu untuk memberi 100%”) dan membuat semacam “cerita” melodi atau narasi panjangnya berkisar hingga beberapa menit — sangat pas untuk soundtrack film.
Lihat di bawah, yang berasal dari urutan “lagu elektronik diputar di videogame”, “lagu meditasi diputar di samping sungai”, “api”, “kembang api”.
Bukan itu saja. MusicLM juga dapat diinstruksikan melalui kombinasi gambar dan keterangan, atau menghasilkan audio yang “dimainkan” oleh jenis instrumen tertentu dalam genre tertentu. Bahkan tingkat pengalaman “musisi” AI dapat diatur, dan sistem dapat membuat musik yang terinspirasi oleh tempat, zaman, atau persyaratan (mis. musik motivasi untuk latihan).
Tapi MusicLM tentu saja tidak sempurna – sebenarnya jauh dari itu. Beberapa sampel memiliki kualitas yang terdistorsi, efek samping yang tidak dapat dihindari dari proses pelatihan. Dan sementara MusicLM secara teknis dapat menghasilkan vokal, termasuk harmoni paduan suara, mereka meninggalkan banyak hal yang diinginkan. Sebagian besar “lirik” berkisar dari hampir tidak berbahasa Inggris hingga omong kosong murni, dinyanyikan oleh suara-suara yang disintesis yang terdengar seperti penggabungan beberapa artis.
Namun, para peneliti Google mencatat banyak tantangan etis yang ditimbulkan oleh sistem seperti MusicLM, termasuk kecenderungan untuk memasukkan materi berhak cipta dari data pelatihan ke dalam lagu yang dihasilkan. Selama percobaan, mereka menemukan bahwa sekitar 1% musik yang dihasilkan sistem secara langsung direplikasi dari lagu yang dilatihnya — ambang batas yang tampaknya cukup tinggi untuk mencegah mereka merilis MusicLM dalam kondisi saat ini.
“Kami mengakui risiko potensi penyalahgunaan konten kreatif yang terkait dengan kasus penggunaan,” tulis rekan penulis makalah tersebut. “Kami sangat menekankan perlunya lebih banyak pekerjaan di masa depan dalam mengatasi risiko yang terkait dengan generasi musik ini.”
Dengan asumsi MusicLM atau sistem seperti itu suatu hari akan tersedia, tampaknya tak terhindarkan bahwa masalah hukum besar akan mengemuka — bahkan jika sistem diposisikan sebagai alat untuk membantu artis daripada menggantikannya. Mereka sudah memiliki, meskipun di sekitar sistem AI yang lebih sederhana. Pada tahun 2020, label rekaman Jay-Z mengajukan teguran hak cipta terhadap saluran YouTube, Sintesis Vokal, karena menggunakan AI untuk membuat lagu cover Jay-Z seperti “We Didn’t Start the Fire” dari Billy Joel. Setelah awalnya menghapus video, YouTube memulihkannya, menemukan bahwa permintaan penghapusan “tidak lengkap”. Tapi musik yang dipalsukan masih berdiri di atas dasar hukum yang suram.
Sebuah whitepaper yang ditulis oleh Eric Sunray, sekarang magang hukum di Music Publishers Association, berpendapat bahwa generator musik AI seperti MusicLM melanggar hak cipta musik dengan membuat “permadani audio yang koheren dari karya yang mereka konsumsi dalam pelatihan, sehingga melanggar reproduksi Undang-Undang Hak Cipta Amerika Serikat Baik.” Menyusul perilisan Jukebox, kritikus juga mempertanyakan apakah melatih model AI pada materi musik berhak cipta merupakan penggunaan wajar. Kekhawatiran serupa telah dikemukakan seputar data pelatihan yang digunakan dalam sistem AI penghasil gambar, kode, dan teks, yang sering diambil dari web tanpa sepengetahuan pembuatnya.
Dari perspektif pengguna, Andy Baio dari Waxy berspekulasi bahwa musik yang dihasilkan oleh sistem AI akan dianggap sebagai karya turunan, dalam hal ini hanya elemen asli yang akan dilindungi oleh hak cipta. Tentu saja, tidak jelas apa yang dianggap “asli” dalam musik semacam itu; menggunakan musik ini secara komersial berarti memasuki perairan yang belum dipetakan. Ini masalah yang lebih sederhana jika musik yang dihasilkan digunakan untuk tujuan yang dilindungi berdasarkan penggunaan wajar, seperti parodi dan komentar, tetapi Baio berharap pengadilan harus membuat penilaian kasus per basis.
Mungkin tidak lama lagi ada kejelasan tentang masalah ini. Beberapa tuntutan hukum yang masuk ke pengadilan kemungkinan akan berdampak pada AI yang menghasilkan musik, termasuk yang berkaitan dengan hak artis yang karyanya digunakan untuk melatih sistem AI tanpa sepengetahuan atau persetujuan mereka. Tapi waktu akan memberi tahu.