Wir haben den KI-Entwickler Alexander Seifert gefragt, der mit seiner Software Textshine an einem perfekten Korrektorat durch künstliche Intelligenz arbeitet. Im Interview spricht er auch darüber, wo die Grenzen des KI-Korrektorats liegen.

In Zeitungen finden wir immer noch ganz viele Rechtschreibfehler, obwohl die Verlage doch mit KI jetzt alles von Rechtschreibfehlern säubern können. Warum finden wir trotzdem noch diese Fehler?
Ich habe schon mit einer dreistelligen Anzahl von Redaktionen gesprochen und ich glaube, so gut wie alle haben es probiert. Abgesehen vom Problem der Integration in fremde Software und Arbeitsabläufe ist es mit KI halt häufig so, dass man mit einem einfachen Prompt zwar schnell ganz gute Ergebnisse bekommt. Aber zu einem zuverlässigen Korrektorat reicht es dann doch nicht, weil die letzten 10 oder 20 Prozent schwierig werden. Da geht es um Feinheiten. Zum Beispiel die Formatierungen beizubehalten. Oder um Verlässlichkeit: Was passiert, wenn die KI ausfällt oder einen Text zurückweist? Teilweise sagen die großen Modelle einfach: Nein, das korrigiere ich nicht, da geht es um Mord und Totschlag und das machen wir wegen unserer Content Policies nicht! Es gibt da einen Rattenschwanz an Problemen, die man alle lösen muss, damit so etwas wirklich zuverlässig funktioniert.
Wir machen oft die Erfahrung, dass die KI auch in Formulierungen eingreift, also eben nicht nur korrigiert, sondern redigiert …
Ja, das machen die Large Language Models sehr gerne, wenn man sie einfach promptet. Sie halten sich eben nicht immer an die Anweisungen und dann wird halt doch umgeschrieben. Unser Anspruch ist es, den Nutzer*innen all diese Dinge aus dem Weg zu räumen. Das funktioniert natürlich auch bei uns nicht zu 100 Prozent. Fehlerfrei korrigiert ja auch der Mensch nicht. Aber ich muss mich als Kund*in darauf verlassen können, dass nicht ungebührlich in den Text eingegriffen und umformuliert und halluziniert wird und dass die Formatierungen erhalten bleiben.
Gibt es denn Zeitungen, die inzwischen ihre Texte mit KI korrigieren lassen?
Ja, mittlerweile gibt es einige Tageszeitungen, die unseren Dienst einsetzen. Manche, um das Korrektorat zu entlasten. Andere haben gar kein Korrektorat mehr und wollen die Redakteur*innen freispielen, damit die wieder mehr Zeit haben für qualitätsvolle journalistische Arbeit.
Liefert Textshine inzwischen fehlerfreie Manuskripte?
Nein. Jeder, der viel mit Texten gearbeitet hat, weiß: Bei großen Mengen von Text ist Fehlerfreiheit unmöglich. Und das ist auch bei Textshine so. Wir sind aber mittlerweile an dem Punkt angelangt, wo wir häufig von Kund*innen das Feedback bekommen, dass Textshine besser ist als durchschnittliche Korrektor*innen. Aus dem Zeitungsumfeld kriegen wir regelmäßig das Feedback, dass unser Korrektorat zwischen dem Niveau guter Korrektor*innen und Redakteur*innen liegt. Gute Korrektor*innen, die die Hausregeln kennen, viel Erfahrung und ausreichend Zeit haben, sind schon noch besser. Aber die Menschen haben ein natürliches Limit. Am krassesten zeigt sich das in der Bearbeitungszeit. Einen Nachrichtentext zu korrigieren, dauert mit KI nur wenige Sekunden. Ein ganzes Buch, auch wenn das ein historischer Roman mit 800 Seiten ist, dauert vielleicht vier, fünf Minuten.
Woran genau beißen sich KI-basierte Korrektoratsprogramme noch die Zähne aus?
Die erste Baustelle ist, einen Text über längere Textpassagen hinweg konsistent zu korrigieren. Bei kurzen Nachrichtentexten ist das kein Problem, aber bei Romanen fällt das schon auf. Das hängt mit den Kontextlängen der Sprachmodelle zusammen. Selbst wenn die Hersteller versprechen, dass sie eine Million Tokens und mehr Kontext verarbeiten können, stimmt das in der Praxis nicht wirklich. Das bedeutet: Man muss den Text segmentieren. Und dann entsteht das Problem, dass die KI unterschiedliche Entscheidungen trifft. Es gibt ja von vielen Wörtern mehrere gültige Schreibweisen und dann kann es einfach passieren, dass die KI mal die eine Schreibweise wählt, mal die andere. Sagen wir: „Baltoro-Gletscher“, den schreibt sie dann einmal mit Bindestrich und einmal zusammen. Für solche Fälle gibt es auch keine Dudenempfehlung.
Du hattest von mehreren Baustellen gesprochen …
Ja, zweitens denke ich an wirklich komplexe Satzkonstruktionen, da ist die Fehlerquote höher. Ich finde das verblüffend, weil es wie beim Menschen ist. Wenn man einen wirklich komplexen Satz hat, zum Beispiel bei Kant oder in der Philosophie insgesamt, dann geht da schon mal ein Satz über ein oder zwei Seiten. Da weiß man am Ende des Satzes nicht mehr, mit welchem Wort vorne das Verb hinten kongruiert. Genauso geht es der KI auch. Das finde ich ganz spannend. Die dritte wichtige Baustelle ist für mich die Zeitenfolge. Da straucheln ja auch wir Menschen häufig. Da macht die KI auch manchmal Eingriffe, wo ich sagen würde, das sollte man im Präsens formulieren, das muss man jetzt nicht in die Vergangenheitsform stellen. Und dann gibt es da noch die Aussetzer. Die sind zwar selten, aber es kommt vor, dass die KI etwas Augenfälliges einfach übersieht.
Außerdem kann ja die KI nichts korrigieren, was außerhalb der Wissensbasis liegt, zum Beispiel im inhaltlichen Kontext. Zum Beispiel, wenn ich ein Pronomen in einem Satz habe – aber es ist gar nicht klar, auf was sich das Pronomen bezieht. Oder beim Gendern, wenn von drei Forschern die Rede ist – aber man erst im Internet nachschlagen müsste, ob da jetzt nur Männer oder nur Frauen oder beide dabei waren? Sowas können menschliche Korrektor*innen ja nachgucken, aber eine KI nicht. Oder gleicht die sowas auch mit einer Webrecherche ab?
Der zweite Fall wäre ja gar kein Korrektorat mehr, sondern eher eine Art Fact-Checking. Aber zum ersten Fall mit dem Pronomen: Unser Programm verwendet den textinternen Kontext. Es ist klug genug, die Referenz für ein Pronomen zu finden, so sie halt eindeutig ist – und dann auch solche Referenzen zu korrigieren.
Werden wir denn irgendwann auch ein KI-Korrektorat haben, bei dem die KI sogar im Web nachguckt, wie sich jemand wirklich schreibt und ob in einem Forscherteam Frauen und Männer dabei waren?
Aber so ein KI-Fact-Checking beim Korrektorat ist für uns aktuell out of scope. Textshine macht in seltenen Fällen durchaus solche Korrekturen, beispielsweise bei der Namensschreibweise berühmter Persönlichkeiten. Aber insgesamt haben beim Fact-Checking die guten Korrektor*innen definitiv die Nase voran, die halten da kurz inne und sagen: Moment, das Forschungsteam recherchiere ich schnell mal …
Und was ist, wenn der Name einer Person mehrfach vorkommt, aber erst so geschrieben und dann anders – irgendwie muss sich ja auch die KI entscheiden?
Tatsächlich macht unsere Maschine diese Form von Korrektur – und das erstaunt die Leute oft. Wir arbeiten für einen der ältesten Musikverlage der Welt. Bei deren Texten hat Textshine mal den Namen eines finnischen Geigers aus der zweiten Reihe des 19. Jahrhunderts korrigiert. Da waren sie alle ganz baff, das war ihnen selber entgangen. Der Name muss aber in den Trainingsdaten sein, also etwa bei Wikipedia. Namen in Lokalzeitungen, die kaum einer kennt, die kennt die KI nicht und kann sie deshalb auch nicht korrigieren.
Macht er das auch, wenn ein Name etwa zehn Mal richtig auftaucht und einmal falsch? Nehmen wir mal das Beispiel der ehemaligen deutschen Fußball-Nationalspielerin Célia Šašić, da ist es mit den Sonderzeichen ein bisschen kompliziert … wie entscheidet die KI das dann?
Okay, nehmen wir mal meinen eigenen Namen: Seifert. Wenn der in einem Text zweimal mit Doppel-f und einmal mit einem f vorkommt, dann würde Textshine vermutlich aufs Doppel-f korrigieren, um die dominante Form durchzusetzen. Wobei ich schon festgestellt habe, dass die erste Form ein bisschen mehr zählt.
Und was ist, wenn Célia Šašić zehn Mal falsch geschrieben wurde und nur einmal richtig?
Dann würde ich vermuten, dass er das eine richtige Mal korrigiert. Wenn es zehn Mal ohne Sonderzeichen geschrieben wird und einmal mit, dann kann es ja auch eine redaktionelle Entscheidung sein, all diese Sonderzeichen nicht zu verwenden. Glaubt es mir oder glaubt es nicht, aber ich kenne Redaktionen, die würden gern Sonderzeichen verwenden, haben aber nicht die Lizenz für alle Buchstaben. Oder die haben die Lizenz für den Fließtextfont, aber nicht für den der Überschrift. Da gibt es alle möglichen Spielarten.
Wo wir schon bei dem Zusammenwirken mit anderen Programmen sind: Wann wird denn Microsoft ein funktionierendes KI-Korrektorat einbetten?
Irgendwann kommt das sicher. Aber Microsoft macht Dinge für die breite Mehrheit, für die 99 Prozent der Benutzer*innen – und die brauchen kein Korrektorat auf so einem Niveau. Die schreiben vielleicht maximal eine Hausarbeit, vielleicht eine Geburtstagseinladung oder eine E-Mail.
Aber jeder möchte doch, dass sein Text richtig ist?
Naja, Schüler*innen möchten das. Die haben ein profundes Interesse daran, dass keine Rechtschreibfehler drin sind. Microsoft stellt sich aber sicher die Frage: Wie viel ist denen das denn wert? Schüler*innen haben keine Kaufkraft und die Eltern werden ihnen nicht die KI-Korrektur bezahlen für Hausarbeiten. Korrektorat auf hohem Niveau zu entwickeln und zu machen, ist teuer und dauert. Ich finde es ja absurd, wenn man den Co-Piloten von Microsoft bittet, einen Text zu korrigieren, und dann kriegt man Vorschläge, wohin man den Text hochladen soll – auf irgendwelche anderen Services.
In Word wäre es immerhin gut integriert, denn damit schreiben ja fast alle. Obwohl wir den Änderungen-nachverfolgen-Modus auch furchtbar finden …
Der Änderungen-nachverfolgen-Modus ist nicht unbedingt intuitiv. Er ist aber so eine Art Industriestandard. Alle kennen ihn, auch wenn ihn niemand liebt. Und er ist auch technisch robust. Ich kann mich darauf verlassen, dass jeder so ein Dokument öffnen und bei sich anzeigen lassen kann. Das war der Grund, warum wir uns dazu entschieden haben, diesen Modus zu verwenden. Da muss niemand irgendwas installieren und man muss nicht extra auf eine weitere Homepage gehen. Man kann das Dokument jemand anderem geben, auf dem USB-Stick speichern, archivieren – und wenn man es in zwanzig Jahren wieder aufmacht, ist halt trotzdem alles da.
Und wo steht das Textkorrektorat in, sagen wir mal, zehn Jahren?
Ich scheue mich ja sehr vor solchen Prognosen. Aber was ich mich traue zu sagen, ist, dass die Entwicklung der KI-Modelle weiter rasant fortschreiten wird. Im Korrektorat habe ich gesehen, wie viel besser wir in den letzten zwei Jahren geworden sind. Da ist auch kein Ende in Sicht. Wir werden sehr bald auf einem Niveau sein, wo wir beim rein sprachlichen Korrektorat besser sind als fast alle Korrektor*innen.
Und was machen dann die menschlichen Korrektor*innen?
Das ist natürlich ein sehr sensibles Thema. Ich denke, Korrektor*innen müssen sich dieser Entwicklung stellen und einen konstruktiven Umgang damit finden, um wettbewerbsfähig zu bleiben. Ich bin überzeugt, dass Korrektor*innen heute schon mithilfe von KI wesentlich mehr Aufträge annehmen können – manche meiner Kund*innen tun genau das. Und man kann das Korrektorat dadurch auch zu einem niedrigeren Preis anbieten und damit neue Zielgruppen erschließen. Oder eine Hybridlösung schaffen: Die KI macht Korrekturvorschläge und die menschliche Korrektor*in schaut noch mal drüber. Ich glaube, es wäre klug, sich solche Formen der Mensch-Maschine-Interaktion zu überlegen. Es ermöglicht neue Angebote und schafft zeitliche Freiräume für andere Arbeiten am Text, für die Higher-Level-Concerns. Man kann dann stilistisch arbeiten, an der Kohärenz, am Tempo und an all diesen Dingen, die einen Text wirklich besser machen.

Neugierig geworden?
Wir von IMKIS lieben es, Entwicklungen rund um Kommunikation und Sprache zu durchleuchten – und geben dieses Wissen auch in Seminaren weiter. Vielleicht finden auch Sie etwas in unserem Portfolio?
UNSERE SEMINARE