Wird man Jason Allens «Théâtre D’opéra Spatial» dereinst in einem Atemzug mit Da Vincis «Mona Lisa» nennen? Vermutlich nicht. Aber das Gemälde des US-Amerikaners hat sich seinen Platz in der Kunstgeschichte gesichert als das erste von einer künstlichen Intelligenz kreierte Bild, das mit einem Preis ausgezeichnet wurde.
Diese kontrovers diskutierte Preisverleihung an der Messe «Colorado State Fair» sorgte weltweit für Schlagzeilen. Auch Dragica Kahlina beobachtet die Debatte aufmerksam. Die HSLU-Dozentin, Digitalkünstlerin und Gamedesignerin experimentiert selbst mit KI-generierter Kunst. Während des Gesprächs zeigt sie auf dem Smartphone eines ihrer Werke, die Bildserie «Streetcafe With People In The Rain»: düstere, in Neonfarben getauchte urbane Szenerien.
Dragica Kahlina, wie haben Sie diese Bilder gemacht?
Ich habe dazu die App «Draw Things» verwendet und sie per Texteingabe angewiesen, ein Strassencafé im Regen zu generieren. Die KI hat auf dieser Basis eine Reihe ähnlicher Bilder produziert. Ich habe dann jenes ausgewählt, welches mir am besten gefiel und es wieder in die KI eingespeist. Diesen iterativen Prozess habe ich etwa sechs bis zehn Mal wiederholt, bis ich mit dem Resultat zufrieden war.
Wurde «Théâtre D’opéra Spatial» mit dem gleichen Programm erstellt?
Nein, hier kam die KI «Midjourney» zum Einsatz. Aber beide Programme funktionieren nach dem gleichen Prinzip: Man gibt einen kurzen Text ein, einen sogenannten Prompt, in dem beschrieben ist, was auf dem Bild zu sehen sein soll. Die KI ist mit einer riesigen Bild-Datenbank verknüpft. Je nach Prompt kombiniert die KI verschiedene Bilder zu etwas Neuem.
Ich habe mich kürzlich an «Midjourney» versucht, aber die KI produzierte nur ein surreales Durcheinander. Was habe ich falsch gemacht?
Die Leute denken, Bild-KIs seien leicht zu bedienen: Man gibt ein paar Begriffe ein und die KI spuckt ein Meisterwerk aus. Aber es braucht sehr genaue Prompts zu Inhalt, Stil, Perspektive und vielem weiterem. Es ist wie an Stellschrauben zu drehen. Zwischen uns und dem fertigen Werk steht eine Maschine, die nur das macht, was man ihr sagt. Sie entscheidet nicht aufgrund einer von ihr wahrgenommenen Wertigkeit oder einer künstlerischen Aussage – weil sie keine sieht.
Mit welchen Sujets bekundet die KI besonders viel Mühe?
Mit Pferden zum Beispiel! Ich versuche mich seit einiger Zeit an einer berittenen Bogenschützin. Aber die vielen Arme und Beine verwirren den Algorithmus. Teils haben die Pferde drei Beine … Die KI kennt zwar tausende Pferde-Bilder, aber sie «weiss» nicht, dass es sich um ein Tier mit vier Beinen handelt, die man – je nach Perspektive – manchmal alle sieht oder eben nicht.
Liesse sich eine KI programmieren, die versteht, was sie malt?
Davon sind wir noch weit entfernt. Dazu müsste die KI wahrscheinlich eine Art Bewusstsein entwickeln. In der KI-Forschung herrscht keine Einigkeit darüber, ob wir etwas derart Komplexes überhaupt entwickeln können.
Wir könnten immerhin eine KI mit Kriterien für «gute Kunst» füttern…
Aber dann wärmt sie einfach 1’000 Jahre Kunstgeschichte auf. Viel interessanter wäre es, wenn die KI wirklich darüber nachdenken könnte, was für sie gute Kunst ist. Wenn sie eine eigene künstlerische Haltung entwickeln würde, die sich von der menschlichen unterscheidet.
Bildende Kunst wird traditionell mit einem Handwerk assoziiert: Ich lerne mit Pinsel, Stift und Farben umzugehen. Das fehlt hier.
Mit dem Aufkommen der Fotografie ist es theoretisch schon lange für alle möglich, ein Bild mit einem künstlerischen Wert herzustellen – auch ohne jahrelang ihre Zeichenfähigkeit zu trainieren. KI-Bilder treiben diese Entwicklung lediglich weiter voran. Künftig wird Kunst noch weniger mit einem klassischen Handwerk verbunden sein, sondern mit einer anderen Form kreativer Arbeit, mit einem Prozess: das richtige Prompt schreiben, die richtige Bilderdatenbank finden, die entstandenen Bilder kuratieren. Das kann genauso relevant sein für unsere Kultur wie ein klassisches Gemälde malen.
Jason Allens preisgekröntes KI-Bild provozierte teils heftige Reaktionen; von Betrug und dem Ende der Kunst war die Rede. Wie beurteilen Sie die Auszeichnung?
[Denkt lange nach] Das ist eine schwierige Frage … Die Jury hat im Bild einen künstlerischen Wert gesehen. Andererseits kann ich den Frust der anderen Künstlerinnen und Künstler verstehen. Sie haben sich über Jahre hinweg einen Stil erarbeitet, verdienen damit ihr Brot. Nun kommt jemand mit einem komplett anderen, textbasierten Prozess und heimst mit seiner Arbeit gleich einen Preis ein.
Welche Möglichkeiten sehen Sie, um die beiden Sichtweisen miteinander zu versöhnen?
Wir müssen neue Kriterien entwickeln, um zu bestimmen, was Kunst ist und was nicht. Weil bei KI-Bildern der Prozess und nicht das Handwerk im Vordergrund steht, könnten wir sie etwa als Prozesskunst labeln, um sie klarer von den anderen Formen der bildenden Kunst abzugrenzen.
Die KI kennt zwar tausende Pferde-Bilder, aber sie «weiss» nicht, dass es sich um ein Tier mit vier Beinen handelt
Programme wie Midjourney und Draw Things greifen auf Bilder zurück, die andere gemacht haben. Wem gehört das neue KI-Bild? Der Person, die es erstellt hat? Oder den Künstlerinnen und Künstlern, die die Vorlagen gemalt haben?
Das ist ein ungelöstes Problem! Mir persönlich ist unwohl, «meine» KI-Bilder auf den sozialen Netzwerken zu veröffentlichen, weil ich nicht weiss, auf welche Vorlagen das Programm zugreift. Wir brauchen dringend eine KI, die ausschliesslich mit öffentlich verfügbaren Public-Domain-Bildern arbeitet. Es geht wohl nicht mehr lange, bis Disney oder ein anderer Unterhaltungskonzern das Programmierteam einer Bild-KI verklagen, weil darin «ihre» Bildstile enthalten sind.
Ist das nicht einfach «Fan Art»?
Das ist nicht das gleiche: Bei Fan Art ist meistens der Stil des Fan-Künstlers oder der Fan-Künstlerin erkennbar, wobei es auch da immer wieder Streit über die Urheberrechte gibt. Bei KI-generierten Bildern verschärft sich das Problem. Der ursprüngliche Stil wird immer besser kopiert, so dass man immer schlechter erkennt, ob man ein Original vor sich hat oder ein Imitat. Kein Filmstudio kann sich solche Trittbrettfahrer auf Dauer leisten.
Wie könnte man dieses Problem lösen?
Künstlerinnen und Künstler könnten zum Beispiel Bilder als Trainingssets für KIs malen und die Urheber- und Nutzungsrechte darauf verkaufen. Auf jedes damit neu generierte Bild werden Tantiemen fällig. Möglich wäre auch, diese Werke mit einer digitalen Wassermarke zu versehen, damit klar ist, auf welchem Trainingsset sie basieren.
KI in der Kreativbranche
Künstliche Intelligenz kommt auch in anderen Bereichen der Kreativbranche zum Einsatz:
Gamedesign: Derzeit entsteht eine neue Generation von KIs, die aus zweidimensionalen Bildern dreidimensionale Versionen macht. Dies bietet gerade für kleine Entwickler-Studios riesige Chancen, wie Dragica Kahlina sagt. Ein Artteam braucht derzeit rund sechs Wochen Arbeitszeit, um ein zweidimensionales Konzeptbild in ein spieletaugliches 3D-Modell zu überführen. Eine KI könne das in einem Bruchteil der Zeit leisten.
Musik: Künstliche Intelligenz ahmt immer besser Musikinstrumente nach und komponiert inzwischen ganze Tracks in bestimmten Stilen. Auch hier sieht Dragica Kahlina vorab für kleine Bands Potenzial, die sich kein ganzes Orchester leisten können. Die neuesten Musik-KIs seien sogar so gut, dass sie die Stimme bekannter Sängerinnen und Sänger nachahmen können – «theoretisch könnte also ein Plattenlabel neue Johnny Cash-Songs produzieren, obwohl der Sänger schon lange tot ist».
Sie sind Dozentin im Bachelor Digital Ideation, der Design, Kunst und Informatik verbindet. Welche Rolle spielt KI-Kunst im Unterricht?
Das Thema rückt zunehmend in unseren Fokus. Wir Dozierende diskutieren es sowohl untereinander als auch mit den Studierenden. Sie interessieren sich sehr dafür. Die Ersten von ihnen planen bereits Abschlussarbeiten dazu. Ich bin sehr gespannt, wie sich unsere Studentinnen und Studenten dem Stoff annähern werden.
Was fasziniert Sie persönlich an Bild-KIs?
Mich interessiert seit jeher, wie digitale Technologien genutzt werden können, um sich künstlerisch auszudrücken. In der KI-generierten Kunst sehe ich insbesondere ein Mittel zur Selbstreflektion: Kann man mit künstlicher Intelligenz die gleiche Emotionalität herstellen wie mit Pinsel oder Stift?
Könnte man Bild-KIs auch benutzen, um Fotos von Prominenten oder Politikerinnen zu fälschen? Das neue «Dall-E 2»-Programm kriegt fast fotorealistische Szenen hin.
Jedes digitale Bild ist eine Ansammlung von Pixeln. Und jeder Pixel kann verändert werden. Eine KI macht das einfach schneller als es bisher mit Photoshop und Co. möglich war. Das Fälschungspotenzial wird dadurch einfach noch grösser.
Wie können wir dieser Entwicklung begegnen?
Bilder wurden lange Zeit lediglich als Interpretation der Realität gesehen. Erst mit der Fotografie wurden ihnen eine «Wahrheit» zugesprochen. Wir müssen wieder lernen, dass Bilder, so realistisch sie uns auch erscheinen, kein Abbild der Realität sind. Das können wir Erwachsenen, indem wir selbst mit neuen Techologien experimentieren, so dass wir besser verstehen, wie digitale Bilder entstehen. Aber wir müssen das natürlich auch unseren Kindern beibringen. Das macht den Kunstunterricht an den Schulen künftig umso wichtiger.