Kan musik skabt af kunstig intelligens erstatte menneskabt musik? Og er vores hjerner virkelig til fals for den?
Det spørgsmål er hyperaktuelt lige nu. Dels fordi den danske musikrettighedsorganisation KODA har lagt sag an mod den amerikanske musiktjeneste Suno, der producerer sange ved brug af kunstig intelligens. Anklagen lyder på rettighedstyveri.
Dels er AI-sange begyndt at optræde på diverse hitlister. For eksempel ’Hardt å føle og umulig å si’, som for nylig toppede hitlisten på Spotify over mest delte sange i Norge.
I boksen nedenfor kan du læse min vurdering af sangen.
Og i resten af artiklen forsøger jeg som hjerneforsker og musiker at give et svar på, hvordan denne udvikling stiller musik skabt af mennesker.
\ Hardt å føle og umulig å si
Sangen ’Hardt å føle og umulig å si’, der efter sigende skabt ved hjælp af AI og har været på den norske hitliste, er nærmest umulig at skelne fra menneskeskabt popmusik. Vokalen er imponerende naturtro, og nummeret indeholder mange af de elementer, som er typiske for genren.
Det gælder for den musikalske form, akkorder og instrumentering. Interessant nok er den en smule mere enkel end typisk for genren. De samme fire diatoniske akkorder gentages uden afveksling gennem hele nummeret, og alle formstykker er af samme længde.
Dette kan skyldes, at AI grundlæggende forsøger at finde en middelværdi af alt, hvad den er blevet fodret med, og dermed renser ud i de små afvigelser, som de fleste producere lægger ind i numrene – blandt andet for at gøre vores hjerner interesserede i dem, så vi lytter til dem igen.
AI bruger samme princip som en komponist
For at svare på, om vores hjerner køber ind på AI-musik, er man nødt til at forstå både teknologien bag AI-musik, men også hvordan den menneskelige hjerne opfatter og skaber musik.
Begge dele handler i høj grad om statistisk læring og ’predictive coding’, der lidt løst kan oversættes til ’forudsigelsesbaseret kodning’.
Statistisk læring går grundlæggende ud på, at vi ubevidst lærer, hvordan musik er skruet sammen, ved at lytte til en hel masse forskellig musik. Derefter kan vi skabe musik, som ligner, men alligevel ikke er det samme. Samme princip gør sig i øvrigt også gældende, når vi lærer sprog.
På samme måde bruger computeren statistiske modeller til at forstå regelmæssigheder i data ud fra en meget stor mængde af data – for eksempel en hel masse sange.
Computeren genererer herefter ny musik ved at samkøre moduler, der er ansvarlige for musikteoretiske regelmæssigheder, instrumentering, vokal og struktur.
Det kan for eksempel være ved at sørge for, at rækkefølgen af akkorder passer til en given musikalsk stil.
Statistisk læring ligger ligeledes til grund for den måde, programmerne sammensætter teksten og producerer musikken med instrumenter, vokal og så videre - og sætter det hele sammen på en meningsfyldt måde til sidst.
Balance mellem forudsigelighed og afvigelser
En af de vigtigste ingredienser i menneskeskabt musik er at balancere kompleksiteten.
Den rigtige balance mellem forudsigelighed og afvigelser gør hjernen interesseret og kan påvirke både følelser og vores nydelse af musikken.
Det gælder for eksempel for rytmik, hvor den rette balance mellem at kunne finde de fire slag i takten og samtidig blive udfordret gør, at vi får lyst til at bevæge os og føler nydelse derved.
Det er computeren rigtig god til at efterligne, idet den kan bruge statistikken til at ramme et gennemsnit mellem forudsigelighed og nyhed.
Så langt ligner processerne for menneskeskabt musik og AI-musik altså hinanden – med den forskel, at computeren kan bygge sine sange på mange flere stykker musik, end det er muligt for et enkelt menneske at lytte til i et helt liv.
Det burde jo give en konkurrencefordel til computeren.
Alligevel mener jeg som hjerneforsker og musiker, at der er et punkt, hvor AI-musik vil have svært ved at udfordre menneskeskabt musik, både på den korte og den lange bane.
Vi bliver smittet af følelser
Forskningen i musik og hjerne peger på en del forskellige veje, ad hvilke musik kan påvirke menneskelige følelser.
En af disse kaldes for emotionel smitte, og kan kort sagt beskrives som den fornemmelse, vi indimellem får, når vi lytter til et stykke musik og tænker: »Jeg ved præcis, hvordan kunstneren føler lige nu«.
Det involverer en lang række dele af hjernen, der blandt andet handler om at integrere og oversætte andres handlinger og følelser til os selv.
Emotionel smitte kræver, at vi oplever en intention bag musikken – det, som kunstneren vil os med sin musik - og at den intention kommer fra et andet menneske.
Det sker i højere grad i en kontekst, hvor kunstneren føles nærværende, som for eksempel ved livemusik. Og her er vi inde ved kernen af, hvad musik er, og hvorfor vi har den.
Hvis der er en evolutionær grund til, at vi har musik, vil de fleste forskere pege på, at det er dens evne til at kommunikere følelser mellem mennesker, ligesom når vi sidder til en koncert og har fornemmelsen af, at vi er mange, der føler det samme som kunstneren.
Livemusik kommer i højere kurs
Dermed ikke være sagt, at vi ikke ser ind i en fremtid hvor AI-skabt musik er overalt. Og det er også meget sandsynligt, at vores hjerner vil blive forsøgt narret til at tro, at vi lytter til menneskeskabt musik, hvor det i virkeligheden i høj grad er computergenereret.
Men jeg forudser også en modreaktion, hvor ’rigtig’ musik - og måske især livemusik - kommer i endnu højere kurs.
Ligesom når det gælder skak: Selvom verdens bedste skakspiller, Magnus Carlsen, for længst har fået baghjul af computerne, er der ingen, der gider se dem spille mod hinanden. Til gengæld er han selv meget inspireret og lærer af, hvordan computeren spiller.
På samme måde forestiller jeg mig, at musikere og komponister kan få meget ud af AI, når vi først lærer at bruge det.

































