Warum oft pauschal von Algorithmen-Regulierung die Rede ist, wenn eigentlich KI bzw. maschinelle Lernverfahren gemeint sind, und warum das historisch zwar korrekt, aber gegenwärtig völlig irreführend ist.
Bis vor kurzem quittierte ich Meldungen über die Notwendigkeit einer pauschalen Regulierung von Algorithmen mit Kopfschütteln. Algorithmenethik, Algorithmen-TÜV, Algorithmenwatch usw. waren Begriffe, die bei mir einerseits den Reflex auslösten: Klar geht es um Algorithmen, wenn computerbasierte Systeme der Gegenstand der Betrachtung sind! Denn nur durch menschengeschriebene Algorithmen erhalten Computer ihre Anweisungen. Andererseits hatte ich den Eindruck, dass durch solche Forderungen das Kind mit dem Bade ausgeschüttet wird. Bei einer Malaria-Plage werden ja auch nicht alle Insekten, oder gar alle Lebewesen, als Multiplikatoren eines Problems angesehen. Denn wir wissen es besser: es ist die Anopheles-Stechmücke. Wenn wir in unserer Hilflosigkeit dann generische Insektenvernichtungsmittel anwenden, hat das ungerichtete Folgen, die neue Probleme für potentiell alle Lebewesen verursachen. Diese Hilflosigkeit dürfen wir bei menschengemachten Systemen – und somit Problemen – erst recht nicht haben. Anders gesagt: wir können als Erzeuger die System-Fehlerquelle mittlerweile ziemlich gut eingrenzen und sollten bei Lösungen möglichst dort ansetzen: bei maschinellen Lernsystemen, insbesondere bei künstlichen neuronalen Netzen, die aus alten Beispielen von Problemlösungen (sog. Trainingsdaten) ein allgemeines Problemlösungsmodell abstrahieren. In solchen Systemen muss beobachtet werden, ob ihre gelernte Verallgemeinerung für einzelne Personen gilt (also ob die verwendeten Trainingsdaten diese repräsentieren) und geprüft werden, ob ihnen dadurch geschadet wird, indem ihre Selbstbestimmung oder gesellschaftliche Teilhabe eingeschränkt wird. Das Spezifische an diesen Systemen ist jedoch die Abhängigkeit ihres Verhaltens von den Trainingsdaten. Diese – und nicht der Algorithmus – sind der erste Ort der Fehlersuche. Die Lernalgorithmen sind dann nur noch die Multiplikatoren dieser „Fehler“ – also der falsch verallgemeinerten und falsch angewandten Datenmodelle.
Im Gegensatz zu klassischen KI-Systemen, oft auch wissensbasierte oder symbolische Systeme genannt, steckt die Lösung eines Problems (z.B. die Zuweisung von Weiterbildungsmaßnahmen an Arbeitssuchende) nicht in den Algorithmen der maschinellen Lernverfahren sondern in der Gesamtheit der von ihnen verwendeten Trainingsdaten, die eben alte Beispiele für Problemlösungen (z. B. bekannte Fälle erfolgreicher Weiterbildungsmaßnahmen bei Arbeitssuchenden) abbilden. Der Algorithmus selber ist eine Anweisung, wie aus den Beispieldaten eine allgemeine Lösung des Problems gelernt werden kann. Im täglichen Einsatz zur Auswahl passender Arbeitssuchender wird in unserem Beispiel also gar kein Algorithmus mehr eingesetzt!
Warum ist dann trotzdem von Algorithmen die Rede? Bisher dachte ich, der Grund dafür ist die eingangs beschriebene Verallgemeinerung durch disziplinfremde Personen. Ich muss zugeben, dass bei mir erst durch ein Interview mit gerade einer Literaturwissenschaftlerin – Pamela McCorduck – der Groschen fiel. Sie beschrieb die Anfangszeit der KI-Forschung und den historischen Übergang zu maschinellen Lernverfahren, die den Fokus auf Algorithmen legen, „which was completely different“. Auch wenn sie es nicht aussprach, wurde mir durch ihre Betonung klar, was dahinter stecken könnte. In wissensbasierten KI-Ansätzen steckte „die Intelligenz“ in den Wissensrepräsentationen. Ihre Struktur gab implizit vor, welche Schlussfolgerungen Algorithmen aus ihnen ziehen konnten. Wie auch sonst in der Computerprogrammierung sind Algorithmen und die von ihnen verwendeten Datenstrukturen eng gekoppelt. Diese Verzahnung fällt bei maschinellen Lernverfahren weg. Der Lernalgorithmus kann dadurch ohne Rücksicht auf die Struktur der von ihm verarbeiteten Daten formuliert werden. Aus informatischer Sicht ist das eine relevante Abgrenzung datengetriebener von wissensbasierten KI-Ansätzen. Der Fokus der Entwicklung liegt auf den Algorithmen und nicht auf den Datenstrukturen! Für die praktische Anwendung von KI-Systemen und gar für ihre Regulierung ist diese Abgrenzung jedoch irrelevant, wenn nicht sogar irreführend. Denn sie wirft das Schlaglicht nicht auf den Hauptdarsteller maschineller Lernverfahren – den Trainingsdaten – sondern auf dessen Handlagern – den Lernalgorithmen. Deswegen sollten die Scheinwerfer aus den Händen von Theoretiker:innen in jenen der verantwortlichen Praktiker:innen gelegt werden, damit sie Licht ins Dunkel bringen statt uns zu blenden.