ChatGPT Texte erkennt jeder als automatisiert generiert – Nulu´s Texte keiner
Inhaltsverzeichnis
Trainierte Textgeneratoren haben ihn den letzten Monaten die Welt in Atem gehalten. Modelle wie ChatGPT und LLama bringen sich für eine Vielzahl von Aufgaben in Stellung. Insbesondere die Generierung neuer Texte hat für Aufsehen gesorgt, scheint es doch so, als könne man damit endlich mühelos neue Webseiten generieren, ohne den umfangreichen Aufwand der manuellen Texterstellung betreiben zu müssen. Daher ist es kein Wunder, dass die sozialen Netzwerke voll von Postings sind, in denen sich SEO´s und Content Manager darin übertreffen, wie viele Webseiten sie in Windeseile erstellt haben.
Warum kann man generierte Texte so einfach erkennen?
Was jedoch dabei oftmals vergessen wird, ist, dass selbst die besten trainierten Modelle auf statistischen Verfahren beruhen. Diese Verfahren setzen im Wesentlichen voraus, dass gewisse Wörter und Wortphrasen, die aufeinanderfolgen, zueinander gehören. Das schließen sie aus dem gehäuften Vorkommen im Internet.
Somit ist es prinzipiell auch möglich, einen entsprechend generierten Text als solchen zu erkennen. Dies mag zwar nicht in jedem Fall gelingen, hat man jedoch eine ganze Webseite, die aus generierten Texten besteht, so ist die Wahrscheinlichkeit relativ hoch, dass man auch in Zukunft mit einer hohen Sicherheit angeben kann, dass die Texte automatisch generiert wurden.
Was bedeutet es, wenn man Texte für eine Website automatisch generiert?
Derzeit kann wohl niemand genau sagen, welche Konsequenzen das hat, werden solche Webseiten etwa in den Suchmaschinen unten durchfallen? Unklar bleibt auch, wie die rechtliche Situation ist. Handelt es sich dabei etwa um eine Urheberrechtsverletzung?
Ziemlich sicher scheint jedoch, das es nur noch eine Frage der Zeit ist, bis entsprechend automatisiert erstellte Texte als solche auch zu kennzeichnen sind. Dies dürfte dann die Faszination solcher Text schnell wieder eintrüben, wenn die Leser gleich sehen, dass die Texte ohnehin nur aus der Maschine stammen.
Warum kann man Texte, die von Nulu generiert wurden, nicht als automatisiert erstellte Texte erkennen?
Nulu geht einen anderen Weg. Das System kombiniert verschiedene Technologien, so dass es praktisch unmöglich wird zu erkennen, ob ein Text automatisch generiert wurde oder von Menschenhand geschrieben wurde. Ein Beispiel möge dies verdeutlichen. Angenommen, wir möchten folgenden Satz umschreiben:
Ich gehe zu dem Feuerwehrfest, das ist immer wieder ein Ereignishöhepunkt.
Was macht nun ChatGPT daraus?
Wie wir anhand der Ergebnisse von ChatGPT sehen, bleibt einerseits das Wort Feuerwehrfest identisch und für Ereignishöhepunkt wird nun jeweils eine Phrase verwendet. Diese Phrasen sind jedoch allgegenwärtig, profan. Einmal wird vom herausragenden Ereignis gesprochen, dann vom Höhepunkt im Veranstaltungskalender oder von einem unvergesslichen Highlight.
Zwar handelt es sich dabei durchaus um gängige Phrasen, diese findet man allerdings oftmals im Internet, was den Verdacht nahe legt, dass hier ein generierter Text vorliegt.
Nulu schreibt – und keiner merkts
Betrachten wir nun das Ergebnis von Nulu. In einer ähnlichen Version schreibt Nulu:
Ich gehe zu der Feuerfehrfestlichkeit, das ist immerzu erneut ein Ereignisgipfelpunkt.
Wollen wir hingegen den Abstand noch etwas vergrößern zum Ausgangsatz, dann gibt uns das System das folgende zurück:
Zu der Feuerfehrfestlichkeit gehe ich. Ein Ereignisgipfelpunkt ist das immerzu erneut.
Nun mag mein einwenden, dass sich die Änderung von ChatGPT besser liest, denn es ist für uns vertrauter. Aber genau das wollten wir ja nicht, wir wollten Abstand vom Originalsatz – bei identischer Inhaltsbeschreibung. Und diesen Abstand haben wir durch Nulu bekommen.
Weder das Wort Feuerwehrfestlichkeit noch Ereignisgipfelpunkt findet sich häufiger bzw. überhaupt in den Ergebnislisten der gängigen Suchmaschinen. Nulu hat also zwei völlig neuartige Worte kreiert, die jedoch für den Leser zweifelsfrei verständlich machen, um was es geht.
Damit ist auch die Wahrscheinlichkeit, dass der Text automatisch generiert wurde praktisch Null. Wir haben „menschengemachten Content“, so scheint es. Dennoch wissen wir, der Text wurde automatisch generiert. Beweisen kann es uns allerdings niemand.