KI-Detektoren – tricksen KI-Humanizer sie aus?

geändert am 28. Juni 2024

KI schreibt Texte, KI-Detektoren entlarven Sie, noch nicht perfekt, aber immer besser. Auf den Markt drängen sich inzwischen sogenannte KI-Humanizer, die angeblich KI-Texte in von Menschen verfasste Texte umwandeln. Aber wie gut funktionieren sie? Das wollte ich wissen und teste bypassGPT.ai und Undetectable AI mit den KI-Detektoren Originality AI, GPTZero und Co. aus. Mit ernüchterndem Ergebnis. Nur Originality.ai*. überzeugte.

KI-Detektoren
Von wem stammt der Text? Mensch oder KI? So sieht es Dall-E 3 von Bing Chat

Test: KI-Detektoren vs. KI-Humanizer

Im spannenden Ringen zwischen KI-Detektoren und KI-Humanizern kommt es zu einem digitalen Schlagabtausch. Im Test werfen ich einen Blick auf die faszinierende Konfrontation dieser Algorithmen: Welche Seite setzt sich durch? Entdecken Sie, wie KI-Detektoren versuchen, KI-generierte Texte zu entlarven, und ob KI-Humanizer geschickt genug sind, um diesen Erkennungsmechanismen zu entkommen. Willkommen zu einem Duell der Algorithmen!

Vorgehensweise des Tests

Zunächst erstellte ich einen Text mit ChatGPT. Ich wollte es zunächst einfach halten und ließ andere KI-Textgeneratoren außen vor. Der Text sollte nicht zu lang ausfallen, da kostenlose Tools meist mengenmäßig beschränkt sind. Im Anschluss wollte ich zwei KI-Humanizer nutzen, um die Ergebnisse zu vergleichen So stellte ich an ChatGPT folgende Aufgabe:

Aufgabe an ChatGPT:

Aufgabe an ChatGPT: „Schreibe mir einen ganz kurzen Artikel zu KI-Detektoren, um KI-Texte von ChatGPT & Co. zu entlarven und, ob es sogenannte KI-Humanizer schaffen diese zu umgehen.“

Ergebnis von ChatGPT

KI-Detektoren und KI-Humanizer: Das Duell der Algorithmen

Mit fortschreitender KI-Entwicklung wird das Katz-und-Maus-Spiel zwischen KI-Detektoren und KI-Humanizern immer faszinierender. KI-Detektoren, die darauf abzielen, KI-generierte Texte zu entlarven, setzen auf komplexe Algorithmen, um Muster und Abweichungen zu erkennen. Ihr Einsatzbereich reicht von der Überprüfung sozialer Medien bis hin zur Analyse von Nachrichtenartikeln.

KI-Detektoren im Einsatz:

  • Algorithmen, die Muster und Merkmale analysieren.
  • Erkennung von KI-Texten in sozialen Medien und Nachrichten.

KI-Humanizer als Herausforderung:

  • KI-Modelle, die Texte menschenähnlich gestalten.
  • Verwendung von natürlicher Sprache, Kontextbezug und Variation.

Die Frage, die bleibt: Können KI-Humanizer die Detektoren überlisten und damit die Erkennung von KI-Texten erschweren? Dieses ständige Duell zwischen der Entlarvung und der Verfeinerung von KI-generierten Inhalten zeigt, wie sich die KI-Technologie ständig weiterentwickelt.“

Ergebnis des KI-Detektors GPTZero

Zunächst lud ich den 100 % von ChatGPT generierten Text in den KI-Detektor GPTZero* hoch. Anschließend wollte ich ihn mit einem Humanizer überarbeiten und das Ergebnis vergleichen. Allerdings macht mir GPTZero* einen Strich durch die Rechnung, denn der KI-Detektor erkannte meinen KI-Text als 90 % von Mensch erstellt und 10 % als gemischt, KI (AI) erkannte der KI-Detektor in diesem Text überhaupt nicht. Ich war schockiert, wie kann das sein? War meine Aufgabenstellung zu menschlich, indem ich Begriffe verwendete wie entlarven oder umgehen?

KI-Detektoren, GPTZero

Ergebnis des KI-Detektors Originality.ai

Ich lud den Text hoch und begann den Scan mit Originality.ai*. Um das genaue Ergebnis zu erhalten hätte ich mich anmelden sollten. Da dies aber eindeutig war 0 % Original (menschlich), 100 % KI, verzichtete ich darauf.

KI-Detektoren, Originality.ai

Text vom KI-Humanizer bypassGPT.ai

Im nächsten Schritt überprüfte ich den KI-Humanizer bypassGPT.ai. Mit ihm überarbeitete ich den ChatGPT-Text. Der kostenlose Test erlaubt 125 Wörter, mein Text war ein Tick zu lang, also löschte ich den letzten Satz. Hier rechts der vom KI-Humanizer kreierte Text:

Ergebnis von Originality.ai

Auch hier war das Ergebnis eindeutig. Mit 6 % Original, also menschlich, und 94 % KI-generiert verzichtete ich auf die Details. Also das vom KI-Humanizer bypassGPT.ai gelieferte Resultat überzeugte mich nicht.

KI-Detektoren, Originality.ai

Der KI-Humanizer Undetectable AI

Bei diesem KI-Humanizer lässt sich der kurze Text ebenfalls kostenlos hochladen und anschließend zunächst auf KI überprüfen und danach personifizieren. Der KI-Humanizer überprüft zunächst die Wahrscheinlichkeitserkennung der unterhalb aufgeführten KI-Detektoren.

KI-Detektoren, Undetectable AI

Hier das Ergebnis der KI-Überprüfung

Auch hier ist das Ergebnis mehr als ernüchternd. Nur Copyleaks tippt auf 50 % KI, der Rest ließ sich täuschen. Leider ist Originality.ai* nicht mit dabei.

Anschließend „vermenschlichte“ ich den Text.

KI-Detektor, Undetectable AI

Angeblich entdeckten die aufgeführten KI-Detektoren keine KI mehr. Mit einer großen Ausnahme:

Ergebnis von Originality AI nach KI-Vermenschlichung

Der KI-Detektor Originality.ai* erkannte zu 100 % KI!

Fazit

Derzeit täuschen die KI-Humanizer zwar KI-Detektoren wie GPTZero, Open AI und sogar Copyleaks, davon hebt sich nur der KI-Detektor Originality.ai* ab. Natürlich ist das kein statistisch fundierter Test, aber für mich ist Originality.ai* nach wie vor eindeutig der beste KI-Detektor. KI im Text verstecken funktioniert also nur bei zweitklassigen KI-Detektoren. Hier finden Sie mehr zu Originality.ai*, diesem derzeit wirklich besten KI-Detektor am Markt, und auf welcher Basis er arbeitet.