Maurice Mersinger ist einer der Gründer von klingklangklong, einem Sounddesignstudio aus Berlin, das in der Vergangenheit schon häufiger durch seine Verbindung von Sound und Code auf sich aufmerksam gemacht hat. Zuletzt mit der von Regisseur Sven Sören Beyer und seinem Künstlerkollektiv phase 7 erdachten, inszenierten und mit KI-generierten Oper „Chasing Waterfalls“, die in der Semperoper Weltpremiere feierte und mittlerweile auch in Hongkong zu erleben war. Ein Gespräch über Chancen und Gefahren durch KI und die Unersetzbarkeit des Menschen.
Unsere Kunst lebt von Schmerz und den hat KI nicht.
Hallo Maurice, vielen Dank für deine Zeit. Erste wichtige Frage: Bist das wirklich du, mit dem ich spreche? Oder hast du dir einen digitalen Zwilling für Interviews gebaut?
(Lacht.) Gute Idee! Aber nein, ich bin es wirklich.
Ich frage, weil ihr ja für die KI-Oper „Chasing Waterfalls“ die Sopranistin Eir Inderhaug tatsächlich digital geklont habt.
Richtig. Wobei wir dort nicht ihren semantischen Apparat geklont haben, sondern ihren Stimmapparat physically gemodelt. Also was sie gesagt hätte, haben wir nicht geklont, sondern nur, wie es von ihr gesungen geklungen hätte.
War das jetzt noch mal eine besondere Herausforderung, die KI dahin zu drehen?
Absolut. Also die Text-to-sing-Modelle sind im Vergleich zu Text-to-speech einfach nicht so gefragt auf dem Markt und deswegen in den Kinderschuhen. Wir haben dann angefangen mit einem Open-Source-Modell. Das haben wir immer weiterentwickelt und sind langsam dann dahin gekommen, wie man das überhaupt in eine Opernstimme übertragen kann, weil eine Opernstimme noch mal spezielle physikalische Eigenschaften hat. Das war schon noch ganz schön Forschung, um dann auch diesen Effekt von dem Vibrato und der Atemtechnik und allem anderen hinzubekommen. Dabei haben uns übrigens die Programmierer von T-Systems kräftig unterstützt. Das war tolles Teamwork an der Stelle.
Wie hat sich denn mit deiner Erfahrung, auch aus der Oper, deine Einstellung zu KI entwickelt?
Genauso wie die Fotografie, die in den 1880ern Landschaftsmaler obsolet gemacht hat, ist das erst mal nur eine Technologie, die bestimmte Arbeitsprozesse so vereinfacht, dass man sie nicht mehr von Menschen machen lassen muss. Am Schluss sehe ich es aber vorrangig als politisches Problem. Wir müssen mit KI auf einer ethischen, politischen Ebene gut umgehen, genauso wie wir mit Kraftstoffen und nuklearen Sprengköpfen verantwortungsvoll umgehen müssen. Wir sind zudem große Fans des ästhetischen Outputs und des ästhetischen Potenzials. Sowohl auf visueller Ebene, da kennen es alle schon sehr gut, als auch auf klanglicher Ebene. Da sind wir sehr hinterher gewesen und haben übrigens auch in der Oper ganz viel gemacht. Etwa Synthesizer gebaut mit KI-Modellen, kleinere Mininetzwerke. Weil es einfach diese neue otherworldly Ästhetik hat. Man kennt ja mittlerweile diese neuen morphenden Videos. Aber als sie neu waren, waren sie wirklich mal neu. Das gab’s ja lange nicht mehr. Dass man einen visuellen Stil hat, bei dem man sagt: „Krass, das habe ich einfach noch nie gesehen. Ich check nicht, wie das überhaupt funktioniert.“ Grund genug, das Kunst zu nennen. Wie bei Refik Anadol zum Beispiel.
Wenn ich von KI einen Text schreiben lasse, dann ist der sauber. Aber immer auch irgendwie blutleer. Da steckt erkennbar keine Persönlichkeit im Text. Man erkennt auch keine Absicht hinter dem Text. Weil KI natürlich auch keine Absicht hat. Zumindest jetzt noch nicht. Was meinst du? Kommen wir eines Tages dahin?
Du sprichst den zentralen Punkt an: Intention. Das berührt auch die Frage nach Dystopie und Angst vor der KI. Wird die KI irgendwann der Terminator? Der hatte Absichten. Das hat die KI hoffentlich noch nicht.
Was eine KI nicht hat, ist Ego. Das gehört aber zwingend dazu. In Musik steckt immer Ego. Der Wille, sich zu zeigen, sich zu produzieren, sein eigenes Weltbild der Menschheit zu zeigen und dafür Ruhm und Ehre zu ernten, wenn ich es mal überspitzen darf. Und das finden wir bei der KI nicht.
Deswegen klingen KI-produzierte Sachen immer noch ein bisschen plätscherig. Der fehlt das Motiv, wieso sie das macht. Die KI hat sich nicht vorher darüber aufgeregt, dass der andere Kollege, der mit der Ex-Frau zusammen ist, ein gutes Stück geschrieben hat, und will jetzt selbst ein besseres schreiben. Sondern die KI hat diese Notes durchgepusht durch das neuronale Netzwerk und trifft Entscheidungen, so hätte das die Person X auch gemacht. Das ist vollkommen emotionslos und nur ein komplexes Entscheidungspattern. Der ganze Kern menschlicher Kunst, Drama, Despair, Eifersucht, Liebe, Totschlag, Mord, Romeo und Julia, das ist alles nicht drin. Unsere Kunst lebt von Schmerz und den kann die KI per se erst mal nicht haben ohne Nervensystem. Es wird aber irgendwann sehr schwierig sein, die Sachen zu unterscheiden. Ich bin mir sogar sicher, dass das bald geht. Aber wieso sollen wir das machen?
In Japan und Südkorea gibt es mittlerweile virtuelle Popstars, die zwar nicht wirklich existieren, aber dennoch sehr beliebt sind. Ich frage mich aber, weil Geschichte immer auch eine Geschichte von Gegenbewegungen ist, ob es bald eine Renaissance des Handgemachten geben wird. Werden wir demnächst nicht nur den „Made in Germany“-Stempel kennen, sondern auch ein „Made by humans“-Label?
Ich habe neulich mit einem befreundeten Kameramann gesprochen, der sich Sorgen macht, dass seine Arbeit bald wegfällt. Er ist aber zum Beispiel jemand, der einfach mit seinem VW-Bus durch die Welt tourt und bewusst nur das verdient, was er verdienen muss. Und ihn lieben die Leute einfach. Ihm habe ich gesagt, dass die Leute, die ihn buchen, auch wirklich mit ihm arbeiten wollen. Es wird bestimmt eine Wertschöpfung geben, bei der Menschen einfach mit jemand Nettem zusammenarbeiten wollen.
Und was du vorher gesagt hast, finde ich auch super spannend. Bei der Begeisterungsfähigkeit für Technologie zeigen sich starke kulturelle Unterschiede. Beim Artist Talk zu „Chasing Waterfalls“ in der Semperoper sind wir ganz genau durchleuchtet worden. Da kamen jede Menge sehr kluge, wissenschaftliche und kritische Fragen. Das ging sehr ins Detail und war wirklich ein spannendes Gespräch. Während in Hongkong, wo wir die Oper auch gespielt haben, die Technikstudenten der Kunstuni das einfach nur geil fanden. Die waren begeistert und haben Danke gesagt, dass wir das gemacht haben. Also eine ganz andere Einstellung zu diesem technischen Approach an die Kunst. Deshalb kann man dort auch Fan einer Person sein, die es gar nicht gibt. Das wäre hier, glaube ich, kulturell nicht möglich. Das funktioniert halt in Asien und das finde ich sehr interessant. Das ist erst mal nur eine Beobachtung von mir, aber diese kulturellen Unterschiede können natürlich auch andere Perspektiven für solche neuen Technologien in neuen Bereichen eröffnen.
Eine der Hoffnungen im Zusammenhang mit KI ist, dass sie bald lauter Sachen übernimmt, die Leute nicht gerne machen. Und dass man mehr Zeit haben wird, sich intensiver dem zu widmen, was man gerne macht. Langfristig könnte so die Qualität stark zunehmen und nicht nur die Quantität. Siehst du Ähnliches bei der Musikproduktion?
Ja, genau das ist es. Wir machen zum Beispiel hier und da für befreundete, und auch größere Firmen Produktionsmusik für Imagefilme. Da bringt Google jetzt gerade etwas, das wird diesen Bereich in einem halben Jahr gekillt haben. Da bin ich mir ziemlich sicher. Wir machen das aber auch gar nicht so wahnsinnig gerne. Und für uns stellt sich jetzt dadurch viel eher die Frage, ob wir dann nicht lieber als Musikberater auftreten und Kunden sagen, welche Prompts sie eingeben sollen. Oder sie in die richtige Richtung navigieren. Denn das Gefühl, welches Stück und welcher Stil richtig ist, das wird KI nicht ersetzen können. Sie wird eben nicht sagen: „Ich habe hier ein eindeutiges Gefühl. Wir nehmen für deinen Vintagesessel eben nicht 60er-Musik. Wir machen Dubstep, weil das jetzt hier perfekt passt.“
Zum Schluss habe ich noch eine Frage oder eine Bitte: Was würdest du aus deiner Erfahrung Leuten raten, auf die KI mit Wucht zurollt? Leuten wie mir zum Beispiel?
Ich weiß nicht, ob das ein guter Tipp ist, aber es ist das Einzige, was mir einfällt: Ich kann nur sagen, sich mit den Tools zu beschäftigen, hilft auf jeden Fall, die Berührungsangst zu verlieren, weil man merkt, wo KI-Modelle ihre Schwächen haben. Und ich glaube, das inspiriert einen, vielleicht einen anderen Weg zu finden, wo man wieder seine Stärken einbringen kann. Vielleicht kannst du mit KI eine Geschäftsidee entwickeln, weil du jetzt alles allein machen kannst, wofür du früher zehn Leute gebraucht hast. Offen bleiben, weil es kommt. Und kreativ sein damit.
Vielen Dank!