Prof. Dr. Beta Writer

Svenna Triebler über die Automatisierung wissenschaftlicher und künstlerischer Textproduktion.

Ein beliebter Zeitvertreib auf Twitter ist das Autocomplete-Spiel: Jemand schreibt einen Satzanfang und fordert seine Follower auf, diesen zu übernehmen und dann jeweils das erste Wort auszuwählen, das die Vervollstän-digungsfunktion des Handys vorschlägt. Das Ergebnis ist nicht immer schmeichelhaft: Aus »I‘m such a« machte mein Smartphone beispielsweise »I‘m such a good friend of mine that I am not a good person.« Was hoffentlich weniger über meinen Charakter aussagt als über die grammatischen Fähigkeiten einer doch relativ simpel gestrickten Software.

Grundlage der sogenannten Kontext-Vervollständigung (context completion), für die man nicht einmal mehr die Anfangsbuchstaben eingeben muss, ist einerseits ein Korpus allgemein häufig verwendeter Wortgruppen – auf »Samstag« möchte das Smartphone etwa auch bei weniger feierwütigen Menschen vorzugsweise »Abend« folgen lassen –, zum anderen merkt sich die Software Begriffe, die die jeweilige Nutzerin besonders häufig eingibt. Letzteres macht nicht nur den Reiz von Twitter-Spielchen aus, sondern ist im Alltag durchaus praktisch (nicht zuletzt für meine Generation der digitalen Immigranten, deren Wurstfinger noch an eine klassische, physische Tastatur gewöhnt sind).
Ursprünglich wurden derartige Programme entwickelt, um Menschen mit körperlichen Einschränkungen die Verständigung per Texteingabe zu erleichtern. Prominentester Nutzer einer solchen Software war sicherlich der im vergangenen Jahr verstorbene Stephen Hawking. Der gelähmte Physiker steuerte seinen Sprachcomputer mit der markanten künstlichen Stimme seit 2008 über einen Wangenmuskel; als ihm auch das immer schwerer fiel, bekam die Software 2013 ein Update. Quasi als maßgefertigtes Spezialmodell konnte das mit Hawkings Büchern und Vorträgen angelernte Programm wahrscheinliche Wortfolgen recht treffend vorhersehen und ließ sich so deutlich leichter bedienen.

Während die Entwicklung solcher »mitdenkender« Programme vom Nischenprodukt zum selbstverständlichen Begleiter eines jeden Smartphone-Besitzers ganz nebenbei aufzeigt, wie Barrierefreiheit auch der breiten Allgemeinheit zugute kommt, haben sich Schreibprogramme inzwischen längst selbständig gemacht – sei es als Twitter-Bots, automatisierte Sportreporter, Verfasser von Produktbeschreibungen für Onlineshops oder neuerdings auch in der Forschung: Unter dem Autorennamen »Beta Writer« ist im April dieses Jahres beim Wissenschaftsverlag Springer Nature (nicht zu verwechseln mit dem toxischen Verlagshaus aus Berlin) eine vollständig maschinengenerierte Übersichtsstudie zum Stand der Forschung an Lithium-Ionen-Batterien erschienen.
Da diese Dinger mittlerweile vom Handy bis zum Elektroauto in praktisch allen Bereichen des modernen Lebens zum Einsatz kommen und die entsprechende Fachliteratur längst einen unüberschaubaren Umfang angenommen hat, ist, dürfte die Arbeit nicht nur Computerlinguisten interessieren, sondern tatsächlich auch eine größere Leserschaft unter Fachleuten finden, die sich einen Überblick über den Stand der Technik verschaffen wollen. Wer nicht an der Entwicklung von Akkus arbeitet, dürfte dann allerdings doch die gut 20-seitige, ganz altmodisch von Menschenhand geschriebene Einleitung informativer finden.
Darin werden zunächst die Implikationen der Technologie für das wissenschaftliche Publizieren erörtert: vom Prozess der Peer Review, also der Begutachtung einer Arbeit durch Fachkollegen (und möglicherweise demnächst auch durch den Computer) vor Veröffentlichung, über die Rolle des Autors – »Wenn wir Computern das Schreiben beibringen, ersetzen sie uns ebenso wenig, wie Pianos Pianisten ersetzen. Sie werden gewissermaßen zu unseren Schreibfedern, und wir werden zu mehr als Autoren: Wir werden zu Autoren von Autoren«, zitiert der Verlagsvertreter den Datenanalytiker und Maschinenlern-Experten Ross Goodwin – bis zu einem äußerst vagen Zukunftsausblick: »Wie viele technologische Innovationen könnte auch maschinengenerierte wissenschaftliche Literatur zu einer völlig neuen Form von Inhalt mit besonderen, noch nicht absehbaren Eigenschaften werden. Es wäre höchst vermessen zu behaupten, wir wüssten genau, wohin uns dieser Weg in der Zukunft führen wird.«
Ein bisschen spekulieren darf man aber sicherlich. Schon jetzt lässt sich die Forschung von mehr oder weniger intelligenten Computerprogrammen helfen, insbesondere bei der Analyse großer Datenmengen, die anders gar nicht zu bewältigen wären. Vielleicht ist da der Tag nicht mehr fern, an dem die künstliche Intelligenz auch die Interpretation von Messergebnissen und Ähnlichem übernimmt – und ihre Schlussfolgerungen selbstverständlich gleich in einem Paper zusammenfasst. »Beta Writers« Studie zeigt ja – wenig überraschend – auch, wie die formalisierte Struktur wissenschaftlicher Arbeiten den Algorithmen der Autoren-Automaten entgegenkommt.
Dies führen auch Beta Writers Programmierer (oder, wenn man so will, Meta-Autoren) Christian Chiarcos und Niko Schenk im zweiten Teil der Einleitung aus, in dem sie umfangreich Methodik und Herausforderungen ihres Vorgehens erläutern. Daraus geht unter anderem hervor, dass es ganz ohne Menschen immer noch nicht geht, so etwa bei der Vorauswahl zu berücksichtigender Publikationen. Das Material nach relevanten Inhalten zu durchsuchen und diese zu gewichten, war dann zwar Sache des Computers, allerdings mussten auch hier wieder Menschen die Relevanzkriterien festlegen, ebenso wie den Grad an sprachlicher Kreativität, den sie dem Programm zubilligten: Zu viel Freiheit hätte Unsinn produziert, reines Copy & Paste aus den Ursprungstexten hingegen hätte, wie bei einem menschlichen Autor auch, Ärger wegen Plagiierens gegeben. Tatsächlich war Beta Writer so in der Lage, seine Quellen sinnvoll zu sortieren und mit eigenen Worten zusammenzufassen – wenn auch nicht ganz ohne sprachliche Holprigkeiten, wie das Forscherduo einräumt. Bereinigt wurden diese Stellen nicht, damit sich jeder selbst ein Bild von den Fähigkeiten und Unzulänglichkeiten der Software machen kann. Die »Fehler in der Matrix« in dem rund 250-seitigen, der Natur der Sache gemäß in stocknüchternem Fachjargon abgefassten Konvolut zu entdecken, sei, wie es so schön heißt, als Übung dem Leser überlassen.

Für die Natur- und Ingenieurswissenschaften ist das automatisierte Schreiben zunächst einmal ein interessantes Experiment – auch wenn sich vielleicht die eine oder andere Lithiumbatterien-Forscherin, deren Arbeiten nicht zitiert wurden, übergangen fühlen mag. Das nächste Vorhaben von Beta Writers Schöpfern dürfte dagegen (hoffentlich) kontroverser diskutiert werden: Sie planen, ihr Programm auch in den Geistes- und Sozialwissenschaften zu testen. Aus anderen Einsatzgebieten entscheidungsbefugter Software ist schließlich inzwischen hinlänglich bekannt, dass derartige Programme nicht gerade dazu neigen, gesellschaftliche Verhältnisse zu hinterfragen. Vielmehr übernehmen sie oftmals herrschende Diskriminierungen oder Vorurteile und schreiben sie somit erst recht fest (siehe dazu auch Versorgerin #120).
Man könnte natürlich einwenden, dass das mit dem Hinterfragen ohnehin schon längst nicht mehr erwartet wird und dass die Schwerpunktsetzung in den entsprechenden Fächern auch ohne Computerhilfe stets der gesellschaftlichen Konjunktur unterliegt – deshalb muss man marxistisch geprägte Lehrende an den Unis mittlerweile ja mit der Lupe suchen und stehen derzeit die Gender Studies unter massivem Druck des reaktionären Backlashs.
Immerhin lässt sich aber der ideologische Gehalt der jeweils aktuellen Lehrströmungen leicht aufzeigen (auch wenn viele das nicht wahrhaben wollen); computergenerierte Inhalte hingegen gaukeln Objektivität vor, obwohl ihre »Autoren« gar nicht anders können, als affirmativ auf die existierende Literatur zurückzugreifen (dass das auch auf die meisten Akademiker aus Fleisch und Blut zutrifft – geschenkt). Zusätzlich befördert werden dürfte zudem der Trend in Sozialwissenschaften, Psychologie & Co., sich als quantitative statt als qualitative Wissenschaften zu begreifen – wenn man schon elektronische Rechenknechte zur Verfügung hat, die sich nicht über komplexe statistische Aufgaben beklagen, will man das natürlich auch voll ausnutzen. Der Ausblick auf die künftigen Veröffentlichungen von Beta Writer et al. lässt sich vielleicht am besten mit dem rhetorischen Seufzer zusammenfassen: »Was soll da schon schiefgehen?«

Oder man betrachtet die Entwicklung auf jenem Gebiet, auf dem schon vor mehr als einem halben Jahrhundert mit elektronischer Kreativität experimentiert wurde: Die 1957 entstandene ILLIAC-Suite, benannt nach dem Großrechner an der Universität Illinois, der sie komponierte, gilt als erstes computergeneriertes Musikstück der Welt. Versorgt mit Kompositionsregeln von Kontrapunkt über Zwölftonmusik bis hin zu stochastischen Verfahren, wie sie interessanterweise auch hinter Autocomplete, Beta Writer und anderen textverarbeitenden Anwendungen stecken, schuf der Computer vier Sätze in unterschiedlichen Stilrichtungen, die genauso gut von zeitgenössischen Komponistinnen hätten stammen können.
Was vor rund 60 Jahren noch Spielerei war, ist längst zum Geschäft geworden: Insbesondere im Ambient-Bereich, also bei der Musik zur Hintergrund-berieselung, entstehen mittlerweile vermutlich mehr Stücke ohne menschliches Zutun als mit. Über die Qualität lässt sich streiten – dass die Kunst bei diesem Genre darin liegt, nicht zu aufdringlich unaufdringlich zu klingen, haben die Computer offenbar noch nicht begriffen. Nervtötend öde statt originell klingen auch die Kreationen von Aiva, einer Plattform, auf der sich Nutzer Musikstücke verschiedener Richtungen von Filmmusik über Pop bis Jazz von einer künstlichen Intelligenz anfertigen lassen können.[1]

Wenn man davon ausgeht, dass die schreibenden Programme eine ähnliche Entwicklung vor sich haben wie die komponierenden, werden sie wohl bald nicht mehr nur Sachtexte produzieren, sondern sich auch literarisch betätigen. Noch liefern entsprechende Versuche ziemlichen Nonsens ab[2], aber in ein paar Jahren schreiben Computer vielleicht schon Groschenromane. Oder eben Songtexte – da wird man dann raten dürfen, ob deren Flachheit einer Software, der Einfallslosigkeit einer Texterin oder einer Kombination von beidem zu verdanken ist.
 

[1] Die Charts haben Kompositionsprogramme bisher noch nicht erobert – hier werden die Algorithmen, an denen sich die menschlichen Produzenten orientieren, vielmehr vom Formatradio und Plattformen wie Spotify vorgegeben. So erhalten Künstler etwa von dem Streamingdienst erst Geld, wenn sich eine Nutzerin ein Stück mindestens 31 Sekunden lang anhört – ausgedehnte Intros haben damit wohl ausgedient. Und als reiche das noch nicht, um die aktuelle Popmusik zu der hirnerweichend langweiligen Veranstaltung zu machen, die sie nun mal ist, kann man per Datenanalyse mutmaßliche Vorlieben des Publikums auskundschaften und damit den nächsten austauschbaren Nummer-1-Hit kreieren.
[2] Die Blog- und Buchautorin Janelle Shane etwa hat eine künstliche Intelligenz Weihnachtslieder schreiben lassen, mit besinnlichen Zeilen wie diesen: »The cattle around the Christmas will be / A very special Christmas with me / Hurry Christmas to you / Cup on the earth!« (Weitere Beispiele finden sich in ihrem Blog »AI Weirdness« unter https://aiweirdness.com/post/168770625987/christmas-carols-generated-by-a-neural-network.)