‘Po prvi put sam kao producentica prestrašena umjetnom inteligencijom’, izjavila je u na svom video blogu na Youtubeu glazbenica i producentica Alice Yalcin Efe nakon što je isprobala Udio – generativni model umjetne inteligencije koji proizvodi glazbu na temelju upita. Glazbeni svijet tako je dobio nešto što se može okvirno okarakterizirati kao ChatGPT za glazbu.
Udio – AI platforma koja kreira glazbu na temelju upita osvanula je na internetu 10. travnja ove godine u obliku besplatne beta verzija dostupne svima, dakle na sličan način kako se ChatGPT pojavio 30. studenog 2022. godine.
U nepunih mjesec dana otkad postoji udio.com gomilaju se šokantne reakcije među specijaliziranim glazbenim blogerima i youtuberima. Te reakcije variraju od velikog oduševljenja do, može se reći, opravdanog straha profesionalaca o tome što im budućnost nosi, jer na sposobnost umjetne inteligencije u ovom segmentu i uz to dostupne kako open source teško je ostati imun na iznenađenje koje vam u manje od jedne minute donese prvo ispunjenje zahtjeva koje ste ovlaš unijeli u Udio.
U upuštanje u igru s tim najnovijim glazbenim alatom za laike i profesionalce ponukala me reakcija Alice Yalcine Efe, jer je to reakcija koja se može mjeriti s onom vlasnika malog kvartovskog dućana kad mu preko puta nikne veliki diskontni centar. Može samo reći: „Drago mi je zbog žitelja kvarta, ali ja moram staviti ključ u bravu.“
Nakon sat-dva provedenih na Udiou svaki glazbenik, producent, tonski majstor i vlasnik studija postaje svjestan da je distopijska budućnost stigla jer je stigao alat umjetne inteligencije koji može zaludjeti svakog laika da bez problema sebi ispunjava glazbene želje.
Kako koristiti Udio?
Registracija je krajnje jednostavna, čak je u međuvremenu i ChatGPT postrožio prijavu obzirom da morate riješiti tri testa s okretanjem vlakića i autića u željenom smjeru (jer su vjerojatno neki uposlili neki AI alat za komunikaciju s ovim AI alatom). Dakle, prijavite se preko nekog od vaših računa (Google, Discord, X) i jedino trebate ispuniti kućicu sa željenim nadimkom, da ne kažem „umjetničkim imenom“.
Slide show tutorial prođete u manje od pet minuta i svodi se na to da uputstva za glazbenu kreaciju upisujete po sistemu ključnih riječi odijeljenih zarezom. Dakle, isti sistem kao i za Midjourney (tko se igrao s tim AI generatorom vizuala, sve zna). Radi lakšeg snalaženja svi žanrovi, glazbeni pojmovi, desetljeća, instrumenti, ženski/muški/zborski vokali i raspoloženja, su već ponuđeni u izborniku ispod kao gotovi tagovi i njima dodajete i kratki opis o čemu je pjesma (Udio već i tu nudi primjer: „A song about the warmth of a campfire with friends“).
Potom ispod imate još samo tri opcije među kojima birate želite li unijeti vlastite (ili tuđe) stihove, ili želite da AI na osnovu tag informacija to učini umjesto vas, ili pak želite da vam generira instrumental i potom klikom na rozi gumb „Create“ započinje vaše prvo veliko iznenađenje.
Udio uvijek istovremeno generira dva glazbena segmenta koji traju 32 sekunde. Izabirate onaj koji vam se više sviđa i odlučujete hoćete li raditi produženu tj. „extended“ verziju s uvodom, s još dijelova i sa završetkom. I tu ćete uvijek dobiti dva rješenja na uvid. I ako iskoristite sve od ponuđenog dobit ćete na kraju gotovu skladbu ili instrumental u trajanju od dvije minute i deset sekundi – sasvim dovoljno za singl. Ako ste nezadovoljni s obje verzije, opet možete kliknuti gumb „Create“ i preslušati dva nova prijedloga. Također možete raditi i remikseve, tj. poboljšanja one trake koju ste odabrali u većem ili manjem rasponu različitosti od „originala“. Također svaki segment može imati i novi tekst. Poželjno je da prilikom kreiranja prve trake upišete samo tekst prve strofe i refrena, jer Udio će vam onda to najbolje optimizirati unutar 32 sekunde (poslije dodajete drugu strofu i refren ili samo refren, ili na koncu instrumentalni solo dio). Napomena je da Udio sa svakom novom izmjenom troši i malo više vremena na generiranje i sklapanje zadanog djela, a nekad javi i grešku, pa samo treba ponovno pritisnuti gumb „Create“. Treba napomenuti da Udio svakom korisniku nudi 600 traka mjesečno (taman da se dovoljno navučete pa da kreiranje više od toga kasnije i plaćate).
Ono što je isto važno napomenuti jest to da u ključne riječi ne možete unositi imena izvođača i bendova i da na taj način ciljate što želite, jer to zasigurno povlači i klauzule koje se tiču prava korištenja nečijeg lika i djela, time i eventualnih naknada. No rip-offa ima na neki način, ali je on vjerojatno tako ugođen da generira sitne izmjename tako da ne možete baš točno uprijeti prstom i reći o kome je točno riječ. Možete naslutiti i reći da je previše slično, ali umjetna inteligencija zasigurno pazi da ne uzme postojeće paterne i aranžmane iz svoje baze koja je zasigurno glazbeni bazen veličine najpopularnijih streaming servisa.
Testiranje autentičnosti zvuka po žanrovima i dekadama
Nakon što mi je donja čeljust ostala visjeti nakon prvih 32 sekunde kad sam čuo koliko prirodnosti unosi Udio u izmaštani song, odlučio sam ga dublje iskušati. U polju elektroničke glazbe, koji god podžanr poželjeli, rezultat je famozan jer nekako i očekujete da na digitaliji utemeljena umjetna inteligencija nema nikakvih problema s digitalnim zvukovima koji se već desetljećima koriste. Dakle, zanimalo me koliko savršeno može oponašati produkcijsku nesavršenost, tj. koliko taj AI može u glazbenom smislu biti, uvjetno kazano, od krvi i mesa.
Odlučio sam da je putovanje u 1960-te dovoljno zahtjevno, jer tada su se mnogi igrali s nivoima kanala i eksperimentirali s produkcijskim pejzažima. Svaka prvotna traka od 32 sekunde sadržala je upravo taj začin, uz to i vokalne izvedbe karakteristične za to vrijeme. Birao sam, što bi se popularno reklo „najkantastiji zvuk“ i neku „bazičnu garažnu prljavštinu“ i nakon par remiksa došao do nekog zadovoljavajućeg rješenja u kojem bubanj zvuči kao da ga odsvirao (i u to vrijeme snimio) Ginger Baker, dok boogie ritam možete pripisati kome god želite iz tog vremena, od Creedencea do Status Quo, a vokal vuče na neku simbiozu glasova Paula Rodgersa i Johna Fogertyja. Dakle, neki bastardni song, ali se ne može reći da Udio tu nije bio na visini zadatka. Dotičnu pjesmu možete poslušati ovdje.
Nešto kasnije se i Ivan Grobenski odlučio poigrati i on je Udio nagazio još zahtijevnije s jazzom, ali i tu je rezultat bio dobar. Činjenica jest da ako u „Create“ tražilicu unesete pojmove synth popa i rocka 80ih s muškim vokalom da će vam Udio izbaciti dva rješenja od kojih je jedno pljunuti Depeche Mode, a drugo pljunuti Duran Duran, ali nedvojbeno je da se kod takvih zahtjeva, gdje su vam važna desetljeća, AI referira na dominantan zvuk upravo željenog glazbenog perioda.
Kvaliteta pjesama na hrvatskom jeziku
Do toga je došlo kad je jedan kolega iz zezancije rekao da bi trebalo napraviti neku pjesmu za Splitski festival. Ubačili smo nasumično kopirani tekst nekog članka s nekog portala, i da, očekivali smo neki engleski akcent nakon kojeg bi odmah zaključili kako je umjetna inteligencija ipak nespremna za štošta izvan engleskog govornog područja. Ali i tu smo bili frapirani umješnošću tog AI alata.
S malo više entuzijazma sam kasnije u „Create“ tražilicu upisao sljedeće pojmove: „a song about wife waiting for her man who is sailor, female vocalists, mandolin, italian music, 1980s, pop music“. Prije toga sam od ChatGPT-a zatražio tekst neke pjesme na temu „more, stina, maslina“, i malo to doradio jer je ChatGPT poetičan k’o traktorska guma, a i kasnije nešto prilagodio kako ne bi negdje visjeli slogovi viška (jer za pjevnost se općenito na to mora obratiti pažnja). Rezultat za koji je kolega rekao da je ženski vokal kombinacija glasova Zdenke Kovačiček i Gabi Novak (a ja tu čujem i treći začin, a nije Meri Cetinić), je ovdje.
Dakako, čim ste ulogirani na Udio možete pristupiti i mnoštvu skladbi sve brojnijih korisnika, među kojima se neki dobro zezaju, a neki kao da misle ozbiljno, tako da imate tisuće sati glazbe za slušanje i glazbe koja po svemu sudeći istovremeno ne pripada nikome i svima i za koju je i suvišno misliti da se tu može potegnuti neko pitanje naplate prava, jer nema tih mravljih matica koje mogu brže izbacivati jajašca koliko na dnevnoj bazi Udio izbacuje potpuno osmišljenu glazbu, makar i malo dijete „lupalo po tastaturi“.
Jasan je stoga i strah Alice Yalcin Efe s početka ovog članka, jer tko će više angažirati neke skladatelje, glazbenike i studija da bi se snimale primjerice glazbene špice i zvučne podloge, kad je dovoljno da bilo tko provede sat-dva uz Udio i ima gotovu stvar potpuno neopterećenu ičijim pravima.
Otvara se i pitanje samih glazbenih autora. Zamislimo samo obrnuti kreativni proces. A to je, da netko nema inspiraciju. Dovoljno je da sjedi pred Udiom dok mu umjetna inteligencija ne izbaci zadovoljavajuće rješenje. Dovoljno je samo skinuti „AI original“ i potom instrumentalnu matricu istog, angažirati neku pravu pjevačicu ili pjevača da to sve ponovi i eto, može se prijaviti na bilo koji festival, pa čak i Eurosong.
Još do jučer su se vodile rasprave da će umjetnoj inteligenciji trebati vremena da bi ušla u polje ideja i kreacije i da će je čovjek tu nekako uvijek „voditi za rukicu“. Ako ćemo o glazbi, te sve teorije su pale u vodu. Kreativni proces i polje ideja u glazbi preuzima umjetna inteligencija, a može se debatirati samo o procjeni opsega te dominacije. Ljudima je pak pružena mogućnost pristupa tom neiscrpnom kreativnom bazenu i nedvojbeno je da će ga koristiti obilato. A tko će biti umjetnik u situaciji kad je svatko na četiri klika do hita, to je tema koja će tek postati aktualna.