\"Tortured Phrases\": Why Bad Paraphrasers Get Papers Retracted
Why \"counterfeit consciousness\" used to mean AI in published papers, how tortured phrases get research retracted, and how to use a paraphrasing tool that doesn't produce them.
Im Jahr 2021 veröffentlichte ein in Toulouse ansässiges Forschungsintegritätsteam eine Liste von Phrasen, die in Informatikarbeiten auftauchten und keinen Sinn ergaben. „Gefälschtes Bewusstsein.“ „Haze vermutet.“ „Fundendes Lernen.“ „Unregelmäßige Wertschätzung.“ „Busengefahr.“ Bei jedem handelte es sich um eine durch einen Thesaurus ersetzte Version eines echten Fachbegriffs – künstliche Intelligenz, Cloud Computing, Deep Learning, Zufallswert, Brustkrebs. Die Arbeiten, in denen sie verwendet wurden, hatten die Plagiatsprüfung bestanden, scheiterten jedoch an der Aufmerksamkeit eines menschlichen Lesers.
Das Team prägte dafür einen Namen: gequälte Phrasen. Die ursprüngliche Studie führte sie auf Paraphrasierungs-Tools zurück — sowohl manuelle, die von Paper-Mills genutzt werden, um Plagiatserkennung zu umgehen, als auch automatisierte, die manche Forschende auf ihre eigene Arbeit anwandten. Die Entdeckung löste eine Welle von Rückzügen aus, die bis 2026 anhält. Nach dem neuesten Stand wurden mehr als 1.400 veröffentlichte Arbeiten zurückgezogen oder als von gequälte-Phrasen-Kontamination betroffen eingestuft, wobei die meisten Fälle in den Bereichen Ingenieurwesen, Informatik und Biomedizin zu finden sind.
Dieser Leitfaden erklärt, was gequälte Phrasen sind, wie sie produziert werden, warum sie Karrieren beenden und Arbeiten zurückziehen, welche Tools Zeitschriften heute verwenden, um sie zu erkennen, und wie Sie sicherstellen können, dass Ihr eigener Paraphrasierungs-Workflow sie nicht produziert.
What tortured phrases are
Eine gequälte Phrase ist ein anerkannter technischer Begriff, der durch ein synonymes Äquivalent ersetzt wurde – normalerweise eines, das grammatikalisch intakt, aber semantisch für jeden auf diesem Gebiet unsinnig ist. Die Transformation erfolgt typischerweise Wort für Wort, ohne Rücksicht darauf, ob die resultierende Phrase etwas ist, was ein Fachexperte jemals sagen würde.
Ein klassisches Beispiel aus der ursprünglichen Studie von 2021: In einem Artikel über „irreguläres Waldland“ (Random Forest) diskutierten die Autoren die „hohe Präzision“ des Modells, bemerkten jedoch nicht, dass sie auch über „Grenzbäume“ (Entscheidungsbäume) und „verwaltetes Aufnehmen“ (überwachtes Lernen) geschrieben hatten. Der technische Inhalt der Arbeit war gewissermaßen echte Recherche – aber die Prosa war von einem Tool verarbeitet worden, das nicht wusste, was dieser Begriff bedeutete.
A typology of how they appear:
Ersetzungen einzelner Begriffe. Gängige Fachbegriffe werden durch ihre Synonyme ersetzt. „Künstliche Intelligenz“ wird zu „gefälschtem Bewusstsein“ oder „gefälschter Gehirnleistung“. „Cloud Computing“ wird zu „Haze Figuring“ oder „Vapor Processing“. Aus „Big Data“ werden „Huge Information“ oder „Enormous Data“.
Ersetzung idiomatischer Phrasen. Legen Sie Phrasen im Feld „Ersetzt“ fest. „Stand der Technik“ wird zu „Zustand der Ausführung“. Aus „Best in Class“ wird „Ideal in Class“. „Echtzeit“ wird zu „laufender“ oder „konstanter Zeit“.
Misshandel mit Akronymen. Akronyme werden ersetzt, als wären sie Wörter. Aus „MRT“ wird „attraktive Resonanzbildgebung“. „RNA“ wird zu „Ribonukleinsäure ätzend“. „JavaScript“ wird in „Java-Inhalt“ fragmentiert.
Domänenspezifische Ersetzungen. Feldspezifische Begriffe werden durch Synonyme aus einer anderen Domäne ersetzt. „Brustkrebs“ wird zur „Busengefahr“. Aus „Solarzelle“ wird „sonnenbasierte Zelle“. Aus „Herzinfarkt“ wird „Herzinfarkt“ (was eigentlich richtig ist, aber in einem Kontext, in dem „Herzinfarkt“ der gängige Begriff ist).
Die grammatikalische Struktur des Satzes ist normalerweise erhalten. Der semantische Inhalt wird zerstört. Ein Rezensent könnte sie beim Überfliegen übersehen; Ein Prüfer mit Fachkenntnissen in diesem Bereich bemerkt dies sofort.
How they happen
Folterphrasen stammen aus verschiedenen Quellen.
Papierfabriken verwenden Tools zur Synonymsubstitution. Dies ist die ursprüngliche Sorge, die den Anlass für die Untersuchung von 2021 gab. Papierfabriken produzieren in großem Umfang betrügerische Papiere, oft indem sie bestehende echte Papiere paraphrasieren und die daraus resultierenden „neuen“ Papiere an Forscher verkaufen, die sich Autorenschaft erkaufen. Um der Erkennung von Plagiaten zu entgehen, führen sie die Quelle einer aggressiven Synonymsubstitution aus. Die Ausgabe besteht die Plagiatsprüfung (keine exakten Zeichenfolgen stimmen überein) und besteht den Scan eines Domänenexperten nicht (die Fachbegriffe sind falsch).
Forscher verwenden kostenlose Online-Umschreibungen ohne Überprüfung. Dies ist die häufigere moderne Quelle. Ein nicht-englischer Muttersprachler, ein Student unter Termindruck oder jemand, der versucht, die Wortzahl zu reduzieren, lässt seinen Text durch ein kostenloses Paraphrasierungstool laufen. Das Tool ersetzt Synonyme im gesamten Dokument. Der Autor liest nicht sorgfältig, weil sich die Prosa immer noch grammatikalisch liest – und reicht eine Arbeit ein, deren fachspezifische Terminologie nun durchweg falsch ist.
LLMs in ungewöhnlichen Eingabeaufforderungskonfigurationen. Moderne Sprachmodelle wie ChatGPT und Claude erzeugen im Allgemeinen keine gequälten Phrasen, wenn sie zum Paraphrasieren aufgefordert werden, da sie den Kontext verstehen. Bestimmte Aufforderungsmuster können jedoch immer noch Substitutionsverhalten auf Wortebene auslösen. Wenn man ein Modell bittet, dies „mit mehr Abwechslung neu zu schreiben“ oder „durchgehend Synonyme zu verwenden“, führt dies manchmal zu einer gequälten Phrasenausgabe, insbesondere bei technischen Inhalten, die das Modell weniger gut kennt.
Übersetzungspipelines durch Zwischensprachen. Die Übersetzung einer Arbeit vom Englischen ins Russische, ins Chinesische und zurück ins Englische (oder eine ähnliche Kette) kann zu Mustern mit gequälten Phrasen führen, da jeder Übersetzungsschritt Äquivalente auf Wortebene ersetzt, die sich nicht wieder in die ursprüngliche technische Terminologie einfügen lassen.
Nach unserer Erfahrung bei der Unterstützung von Forschern ist die zweite Quelle – unschuldige Forscher, die schlechte Paraphrasen verwenden – die häufigste Ursache für gequälte Formulierungen in nicht betrügerischen Arbeiten. Der Autor versucht nicht zu betrügen; Sie versuchen, ihr Englisch zu verbessern oder einen Abschnitt zu kürzen. Das Tool zerstört ihre Terminologie, ohne es ihnen mitzuteilen.
Why they get papers retracted
Gefolterte Phrasen werden mittlerweile entweder als Beweis für die Beteiligung an einer Papierfabrik oder für den nicht offengelegten Einsatz von KI gewertet, was beides bei den meisten Fachzeitschriften Rücknahmeprozesse auslöst.
Die Argumentation ist in den vergangenen zwei Jahren härter geworden. Vor fünf oder sechs Jahren hätte ein Aufsatz mit seltsamer Formulierung noch korrigiert werden können – der Herausgeber hätte den Autor aufgefordert, die Terminologie zu überarbeiten und die Arbeit erneut einzureichen. Heute gilt dieselbe Formulierung als Warnsignal für systematische Probleme. Selbst wenn die zugrunde liegende Forschung solide ist, deuten gequälte Formulierungen darauf hin, dass der Autor den Artikel entweder gekauft hat, einen aggressiven Paraphraser verwendet hat, um eine Plagiatsprüfung zu umgehen, oder seine eigene Arbeit nicht bis zu einem publizierbaren Standard gegengelesen hat. Keine dieser Erklärungen ist überzeugend.
Bestimmte Zeitschriften haben die Richtlinie explizit dargelegt. IEEE, ACM, Elsevier und Springer haben alle im Zeitraum 2024–2025 die redaktionellen Richtlinien aktualisiert, um gefolterte Phrasen als Gründe für den Widerruf zu behandeln, ohne dass ein Absichtsnachweis erforderlich ist. In der redaktionellen Richtlinienaktualisierung 2026 Wiley wurde hinzugefügt, dass „gefolterte Phrasen, die nach der Veröffentlichung entdeckt werden, zum Widerruf führen, es sei denn, der Autor kann nachweisen, dass die Ersetzungen aus einem dokumentierten Übersetzungs- oder Bearbeitungsprozess und nicht aus einer Beteiligung der Papierfabrik resultieren.“
Der Widerruf schädigt auch den Ruf des Autors in einer noch schlimmeren Weise. Zurückgezogene Beiträge bleiben in der Akte des Autors. Fördergeber prüfen. Findungskommissionen prüfen. Co-Autoren, die nicht für die Formulierung verantwortlich waren, werden im Widerruf markiert. Gequälte Phrasen gehören zu den wenigen redaktionellen Themen, die eine wissenschaftliche Karriere, insbesondere für Nachwuchswissenschaftler, funktional beenden können.
How journals are catching them now
The detection ecosystem has matured.
Der Problematic Paper Screener. Der Screener wurde von demselben Team entwickelt, das den Begriff geprägt hat. Er ist ein kostenloses Online-Tool, das PubMed und andere Datenbanken nach bekannten gefolterten Phrasen durchsucht. Es wird von Redakteuren, Peer-Reviewern und Integritätsteams in Zeitschriften verwendet, um Einreichungen und veröffentlichte Artikel zu scannen. Das Tool führt eine regelmäßig aktualisierte Liste von Phrasen – derzeit über 5.000 – und markiert alle Dokumente, die diese Phrasen enthalten.
Redaktionelles Scannen vor dem Peer-Review. Mehrere große Verlage (IEEE, Elsevier, Springer) haben das Scannen gefolterter Phrasen in ihre Einreichungspipeline integriert. Einsendungen werden beim Eingang gescannt. Artikel mit Treffern werden in der Regel vor Beginn der Peer-Review mit der Bitte um Erläuterung an den Autor zurückgesendet.
Überwachung nach der Veröffentlichung. Tools wie der Problematic Paper Screener scannen auch bereits veröffentlichte Artikel. Treffer lösen eine Untersuchung durch das Forschungsintegritätsteam des Herausgebers aus. Je nachdem, was herausgefunden wird, kann die Untersuchung zur Äußerung von Bedenken, zur Korrektur oder zum Widerruf führen.
Rezensentenbewusstsein. Peer-Rezensenten werden zunehmend darin geschult, gequälte Phrasen in ihrem eigenen Bereich zu erkennen. Zu den Gutachterempfehlungen großer Fachzeitschriften gehört jetzt ausdrücklich die „Suche nach ungewöhnlicher technischer Terminologie, die auf Schäden durch Paraphrasierungstools hinweisen könnte“.
Wenn Ihr Aufsatz wegen gefolterter Formulierungen zurückgezogen wird, erfahren Sie das in der Regel innerhalb von 6 bis 18 Monaten nach der Veröffentlichung – oft nachdem der Aufsatz bereits von anderen zitiert wurde, was den Schaden noch verschlimmert, wenn diese Zitate nachverfolgt und benachrichtigt werden müssen.
How to avoid producing them yourself
Ein paar Gewohnheiten verhindern gequälte Phrasen in Ihrer Arbeit.
Fügen Sie nicht Ihren gesamten Methoden- oder Ergebnisabschnitt in eine generische kostenlose Paraphrasierung ein. Dies ist die Aktion mit dem höchsten Risiko. Kostenlose Paraphrasierer, die auf „Einzigartigkeit“ optimiert sind (d. h. die Erkennung von Plagiaten vermeiden), verwenden typischerweise eine aggressive Synonymsubstitution. Sie haben keine Vorstellung davon, welche Fachbegriffe praxisüblich und welche austauschbar sind. Die Ausgabe wird gequälte Phrasen im technischen Inhalt enthalten.
Wenn Sie technischen Text paraphrasieren müssen, verwenden Sie einen zitierbewussten akademischen Paraphrasierer. Tools wie unser Paraphrasierungstool sind darauf trainiert, fachspezifische Terminologie und Zitatformatierung beizubehalten. Fachliche Standardbegriffe – „Deep Learning“, „Random Forest“, „Brustkrebs“, „Strukturgleichungsmodellierung“ – bleiben beim Umschreiben erhalten. Nur die umgebende Prosa ändert sich.
Lesen Sie jeden umschriebenen Abschnitt, bevor Sie ihn einreichen. Suchen Sie insbesondere nach technischen Begriffen, die Ihnen unbekannt vorkommen oder die Sie nicht geschrieben haben. Wenn Sie „falsches Bewusstsein“ sehen, wo Sie normalerweise „künstliche Intelligenz“ schreiben würden, ist das eine gequälte Phrase, die das Tool eingeführt hat. Stellen Sie den ursprünglichen Begriff wieder her. Wenn Sie das Durchlesen mit einem Durchlauf durch einen [KI-Korrekturleser] für nachverfolgte Änderungen (/ai-proofreader) kombinieren, können Ersetzungen leichter erkannt werden, da jede Bearbeitung als eigenständige Änderung erscheint, die Sie ablehnen können.
Überprüfen Sie den übersetzten Text anhand der Quelle. Wenn Sie eine Arbeit über eine KI-Pipeline übersetzt haben, scannen Sie die englische Version auf technische Begriffe, die nicht mit dem übereinstimmen, was Sie in Ihrem muttersprachlichen, fachspezifischen Englisch schreiben würden. Übersetzungspipelines sind eine häufige Quelle für gequälte Phrasen, insbesondere für Englisch-Russisch-Englisch-Ketten, die zur Umgehung von Plagiaten eingesetzt werden.
Verwenden Sie vor der Einreichung den Problematic Paper Screener. Es ist kostenlos. Es dauert etwa 30 Sekunden. Es markiert alle bekannten gefolterten Phrasen in Ihrem Manuskript. Wenn Sie überhaupt einen Paraphrasierer verwendet haben, lohnt es sich, diese Überprüfung als letzten Schritt vor der Einreichung durchzuführen.
Vertrauen Sie „Einzigartigkeitsbewertungen“ nicht als Indikator für Qualität. Tools, die hohe „Originalitäts-“ oder „Einzigartigkeits“-Bewertungen versprechen, erreichen diese Bewertungen normalerweise durch Synonymsubstitution, die zu gequälten Phrasen führt. Plagiatserkennung und gutes Schreiben sind nicht dasselbe. Eine gut zitierte Literaturrecherche mit Feldstandard-Terminologie weist möglicherweise mäßige Ähnlichkeitswerte auf, da die Feldstandard-Begriffe in allen Aufsätzen verwendet werden – und das ist in Ordnung.
Paraphrase Without Destroying Your Terminology
Our paraphrasing tool preserves technical terms, citations, and meaning. Free tier includes every feature.
Try the Paraphrasing ToolSemantische Paraphrasierung vs. Synonymsubstitution
Der Unterschied, der Ihre Arbeit schützt, ist der Unterschied zwischen zwei grundlegend unterschiedlichen Ansätzen zur Paraphrasierung.
Synonymsubstitution ist das, was die meisten kostenlosen Paraphrasierungstools tun. Das Tool nimmt einen Satz, sucht Wort für Wort nach Synonymen und ersetzt sie. „Das neuronale Netzwerk hat eine hohe Genauigkeit erreicht“ könnte zu „Das neuronale Netzwerk hat eine hohe Präzision erreicht“ werden. Manchmal ist die Ausgabe akzeptabel; oft entstehen daraus gequälte Phrasen. Das Tool versteht nicht, was eine Phrase in Ihrem Fachgebiet technisch korrekt macht.
Semantische Paraphrasierung ist das, was gute akademische Paraphrasierer tun. Das Tool versteht die Bedeutung des Satzes und schreibt ihn neu, wobei die Fachbegriffe, die in der Praxis üblich sind, erhalten bleiben. „Das neuronale Netzwerk hat eine hohe Genauigkeit erreicht“ könnte lauten: „Unser neuronales Netzwerk hat beim Benchmark eine hohe Genauigkeit erreicht.“ Die Terminologie bleibt erhalten, da das Tool „neuronales Netzwerk“ als fachspezifischen Begriff und nicht als zu synonymisierende Phrase erkennt.
Der Unterschied ist struktureller und nicht kosmetischer Natur. Ein auf semantischer Paraphrasierung basierendes Tool wird „Brustkrebs“ bewahren, weil es den medizinischen Kontext erkennt. Ein Tool zur Synonymersetzung ersetzt es durch „Busengefahr“, da „Busen“ und „Gefahr“ auf Wortebene Wörterbuchsynonyme für „Brust“ und „Krebs“ sind.
Normalerweise können Sie feststellen, welchen Ansatz ein Paraphrasierungstool verwendet, indem Sie es an einem Absatz testen, der reich an Fachterminologie ist. Fügen Sie einen Methodenabschnitt in das Tool ein. Lesen Sie die Ausgabe. Wenn die Fachbegriffe überlebt haben (Deep Learning, Random Forest, Strukturgleichungsmodellierung, Brustkrebs), verwendet das Tool semantische Paraphrasierung. Wenn Sie neuartige Wörter sehen (profundes Lernen, unregelmäßiges Waldland, Demonstration der Grunderkrankung, Brustgefahr), verwendet das Tool die Synonymersetzung und sollte nicht für akademische Inhalte verwendet werden. Weitere Informationen dazu, worauf Sie bei einem Paraphrasierer auf akademischem Niveau achten sollten, finden Sie in unserem Vergleich von [Paraphrasierungstools, die Zitate bewahren] (/blog/ai-paraphrasing-preserving-citations).
Citation-aware academic paraphrasing that preserves technical terminology. Free tier includes every feature.
Frequently asked questions
F: Wie kann ich vor dem Absenden feststellen, ob meine Arbeit gequälte Formulierungen enthält?
Führen Sie es durch den Problematic Paper Screener (kostenlos auf der Projektseite von Cabanac et al.). Das Tool vergleicht Ihr Manuskript mit einer Liste von über 5.000 bekannten gefolterten Phrasen. Treffer werden mit dem korrigierten Begriff gekennzeichnet. Sie können Ihre Arbeit auch manuell nach technischen Begriffen durchsuchen, die nicht Ihrem normalen Fachvokabular entsprechen. Wenn Sie ein kostenloses Paraphrasierungstool für das Manuskript verwendet haben, sind die Abschnitte mit dem höchsten Risiko normalerweise Methoden und Ergebnisse, in denen die Fachterminologie am dichtesten ist.
F: Was soll ich tun, wenn ich feststelle, dass meine eingereichte Arbeit gequälte Formulierungen enthält?
Kontaktieren Sie umgehend den Herausgeber, bevor das Peer-Review abgeschlossen ist. Erklären Sie, was passiert ist (Sie haben ein Paraphrasierungstool verwendet, mit dem die Ersetzungen eingeführt wurden). Stellen Sie ein korrigiertes Manuskript zur Verfügung. Redakteure behandeln eine proaktive Offenlegung im Allgemeinen ganz anders als eine spätere Offenlegung. Die meisten akzeptieren eine korrigierte erneute Einreichung, wenn Sie handeln, bevor das Problem unabhängig erkannt wird. Wenn die Arbeit bereits veröffentlicht wurde, wenden Sie sich an das Research Integrity Office der Zeitschrift, um eine Korrektur anzufordern. Je früher Sie handeln, desto geringer ist die Chance auf einen formellen Widerruf.
F: Können LLMs wie ChatGPT und Claude sicher zum Paraphrasieren verwendet werden?
Moderne LLMs sind im Allgemeinen deutlich besser als spezialisierte kostenlose Paraphrasierer darin, die technische Terminologie zu erhalten, weil sie den Kontext verstehen. Sie sind jedoch nicht immun gegen verquaste Formulierungen. Bestimmte Prompting-Muster („verwende Synonyme“, „formuliere zur Abwechslung um“, „mache es einzigartiger“) können Ersetzungsverhalten auf Wortebene auslösen. Wenn Sie ein LLM zum Paraphrasieren verwenden, weisen Sie es explizit an, „all technische Terminologie und die Zitatformatierung zu bewahren“, und prüfen Sie die Ausgabe immer anhand Ihrer Quelle. Für Paraphrasierungen mit hohem Risiko auf einem zur Veröffentlichung vorgesehenen Manuskript ist ein zitierungsbewusster akademischer Paraphrasierer sicherer als ein generischer LLM-Prompt.
F: Wie bleibt der Problematic Paper Screener auf dem neuesten Stand?
Das Team dahinter (unter der Leitung von Guillaume Cabanac von der Universität Toulouse) führt eine offene Liste von Phrasen, die aus der forensischen Analyse zurückgezogener und gekennzeichneter Dokumente stammen. Die Community steuert neue Erkenntnisse bei. Während Papierfabriken ihre Substitutionsmuster weiterentwickeln, werden neue Ausdrücke hinzugefügt. Die Liste umfasst derzeit mehr als 5.000 Einträge und wächst monatlich. Wenn Sie in Ihrem eigenen Fachgebiet eine gequälte Phrase entdecken, die nicht auf der Liste steht, können Sie sie beisteuern – der Screener wird nützlicher, wenn die Community fachspezifische Terminologie hinzufügt.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.