Der Code, die Sprache und das Interface
Was Generative AI als neuer Gatekeeper für Journalismus und Öffentlichkeitsarbeit bedeutet
Von Lorenz Matzat
Mittels Statistik wurde der semantische Code menschlicher Sprache geknackt. Nun kann sich Technologie der in der Sprache enthaltenen Logik und Mechanik, der ihr innewohnenden Intelligenz bedienen. Das ist der springende Punkt von Generative AI (GAI) auf Basis der Large Language Models (LLM) [1]: Im Zusammenspiel mit den verwandten Verfahren zur Bild und Tonerzeugung bzw. deren Interpretation – zeichnet sich ein Paradigmenwechsel im Umgang mit Software, den dazugehörigen technischen Geräten und damit digitalen Medien ab.
Dabei ist die erneut entflammte öffentliche Diskussion über „sentinente“, bewusste Maschinen nichts als Effekthascherei. Sie resultiert aus dem Zusammenspiel von technischem Unverständnis, Hollywood-Märchen und männlichem Grössenwahn. Zudem wird die Angst vor intelligenten Maschinen mittels Marketing-Kampagnen aktiv geschürt [2]. So raunt z. B. OpenAI-Gründer Sam Altman gerne über die vermeintlichen kommenden übermenschlichen Fähigkeiten der Technologien, auf die seine Firma setzt - und ruft voll Sorge nach Regulation. Obwohl sein Unternehmen aktiv dagegen lobbyiert [3].
Dabei sind Fragen zur Ethik oder Sorgen über die gesellschaftlichen Auswirkungen von GAI und LLM durchaus berechtigt, nur sind es seit Jahren (oder sogar Jahrzehnten) dieselben: Erschütterung von Arbeitsmärkten, Verfestigung von Vorurteilen (bias) durch automatisierte Diskriminierung, Entmenschlichung durch Abwälzen von Entscheidungsverantwortung an verantwortungsunfähige Maschinen usw. Zudem sind die dazugehörigen Technologien aufgrund ihres Energiehungers und Rohstoffbedarfs (Serverfarmen, Prozessoren) alles andere als nachhaltig und fussen obendrein auf der Ausbeutung von Clickworkern im Globalen Süden [4].
Die universelle API
Zur allgemeinen Verwirrung trägt bei, dass der Auslöser des derzeitigen Hypes, ChatGPT, eher als Tech-Demo denn als durchdachtes Produkt startete: OpenAI wollte Ende 2022 zeigen, was man mit seinem Sprachmodell GPT 3.5 anstellen kann. Dass das schlichte Tool so durch die Decke gehen würde, hatte wohl niemand erwartet [5]. Einer der Gründe für den Erfolg: Die Qualität – trotz aller „Halluzinationen“ – ist beeindruckend. Noch wichtiger: Die Funktionsweise eines Chats versteht so gut wie jede:r, weil quasi jede:r WhatsApp, Telegram & Co. nutzt. Plötzlich erlebten Personen, die nicht den technischen Hintergrund, nicht die Zeit oder Bereitschaft für die Auseinandersetzung mit komplizierten Softwaretools haben, was „KI“ für sie bedeuten könnte.
Doch ChatGPT ist nur eins der Anwendungsszenarien für Generative AI. Vielmehr ist diese Technologie universell: Menschliche Sprache ist das Bindeglied zwischen den meisten Kommunikationsformen, fast alle lassen sich damit beschreiben. Sie ist das Medium schlechthin, eine Schnittstelle. Neu ist, dass sie als digitale API ohne Code-Umweg direkt genutzt werden kann:(application programming interface): GAI kann natürliche Sprache ausreichend gut interpretieren, dass sie mit Menschen sinnvoll interagieren kann (NLP, natural language processing). Nicht zuletzt auch, weil sie nun einen Umgang mit Ambiguität, mit Unklarheit gefunden hat; etwas, an dem beispielsweise die Sprachassistenz durch Siri, Alexa & Co. kläglich scheitert.
GAI wertet Bilder, Videos sowie gesprochene Sprache und Töne aus und beschreibt sie in Worten; umgekehrt können Instruktionen aus Worten (prompts) in Text, Bilder, Videos und Töne übersetzt werden. Der Grad der Imitation kognitiver Fähigkeiten durch GAI ist alltagstauglich.
Neue Gattung Gatekeeper
Angesichts solch einer universellen Technologie steht nahezu allen Branchen ein Wandel bevor. Die Sektoren Journalismus und Öffentlichkeitsarbeit, deren Kern Spracharbeit und Informationsvermittlung sind, werden von dieser Entwicklung voll erfasst. Dabei liegt für sie nahe, auf LLM-Optimierung und LLM-Intergration der eigenen Text- und Datenarchive zu setzen. Ausserdem erscheinen Assistenzsysteme für Informationsgewinnung sowie deren Vor- und Aufbereitung per GAI sinnvoll.
Die grosse Unbekannte dagegen ist, wie sich die Seite der Empfänger:innen aka User wandeln wird. Eine mögliche Entwicklung ist, dass GAI sich im Web als weitere Schicht zwischen diese und die Informationsanbieter legen; in Gestalt einer/eines Gefährt:in, sogenannten Companions. Warum sollten wir denn noch selber Texte, Bilder, Videos und Audios nach für uns nützlichen Informationen durchforsten, wenn eine digitale, autarke Begleitung meinen Wissensstand, viele Inhalte meiner Kommunikation sowie meine Interessen und Bedürfnisse kennt? Ein loyaler, nimmermüde lernender Companion, angenehm in der Interaktion – der Hintergrund in meinem Sinne sucht, liest, schaut und lauscht, um mir dann mundgerecht das Wesentliche, das Neue in dem Format anzuliefern, das ich bevorzuge.
Seien es journalistische Berichte, Kultur-, Wissenschafts- oder Advocacy-Reports: Wenn das algorithmische Sortieren und Kuratieren von Informationen auf Seiten der Companions (mobiler) Betriebssysteme geschieht, würde das Hecheln nach “eyeballs” obsolet. Was sollte ich noch messen, vorweisen können, wenn ich gar nicht weiss, ob meine Information den User erreicht? Wer sähe Appelle und Aufrufe, wer Werbung, wenn gar nicht mehr Menschen meine Website oder App besuchten, sondern bloss gewitzte Automaten? Wie bliebe ich in diesem Medienumbruch mit meinen Inhalten und Anliegen sichtbar?
Ob sich die neue Gattung von Gatekeepern im Sinne oben beschriebener Companions entwickelt, oder sich ein anderer Pfad durchsetzt, etwa eine entsprechende Evolution von HTML und damit des Browsers, kann im Spätsommer 2023 nur Spekulation sein. Noch herrscht Wilder Westen rund um GAI; eine Aufregung, die es so seit der DotCom-Phase vor 25 Jahren nicht mehr gegeben hat. Das Wettrennen um die Dominanz bei den LLM hat eben erst begonnen. Der richtige Zeitpunkt also, die Grundlagen der Formate, Standards und Regeln für diese neue Ära mitzugestalten!
Abonnieren Sie unseren Newsletter:
[1]
[2]
[3]
[4]
[5]