\"Tortured Phrases\": Why Bad Paraphrasers Get Papers Retracted
Why \"counterfeit consciousness\" used to mean AI in published papers, how tortured phrases get research retracted, and how to use a paraphrasing tool that doesn't produce them.
2021年、トゥールーズに本拠を置く研究公正チームは、コンピューターサイエンスの論文に登場し、まったく意味をなさないフレーズのリストを発表した。 「偽りの意識」。 「もやが見えます。」 「深い学び」。 「不規則な評価」 「胸の危険」。それぞれは、人工知能、クラウド コンピューティング、深層学習、乱数値、乳がんなど、実際の専門用語をシソーラスで置き換えたものでした。これらを使用した論文は盗作チェックには合格していましたが、人間の読者が注意を払うことはできませんでした。
チームは、これらの置換に対して「tortured phrases」という名称を付けました。元の論文では、それらを言い換えツールに結び付けています――プラグラリズムの検出を回避するためにペーパーミルが用いる手作業のものと、自分たちの研究に対して一部の研究者が使っていた自動化されたものの両方です。この発見は、撤回の波を引き起こし、それは2026年に入っても続いています。最新の集計によれば、「tortured-phrase」の汚染のために撤回またはフラグ付けされた公表論文は1,400本以上で、その大半は工学、コンピュータサイエンス、そして生物医学分野に集中しています。
このガイドでは、拷問フレーズとは何か、拷問フレーズがどのように生成されるか、キャリアを終了させ論文を撤回する理由、ジャーナルが拷問フレーズを検出するために現在使用しているツール、および独自の言い換えワークフローで拷問フレーズが生成されないようにする方法について説明します。
What tortured phrases are
拷問されたフレーズとは、同義語で置き換えられた同等の用語に置き換えられた、認識された専門用語です。通常は、文法的には無傷ですが、その分野の誰にとっても意味的には意味をなさないものです。通常、変換は、結果として得られるフレーズがその分野の専門家が発言するような内容であるかどうかに関係なく、単語ごとに行われます。
元の 2021 年の研究からの古典的な例: 「不規則森林地帯」 (ランダム フォレスト) に関する論文で、著者らはモデルの「高精度」について議論していましたが、「境界木」 (決定木) と「管理された拾い上げ」 (教師あり学習) についても書いていたことに気づきませんでした。論文の技術的な内容は、ある意味、本物の研究でした。しかし、散文は、これらの用語の意味を知らないツールによって処理されていました。
A typology of how they appear:
単一用語の置換 一般的な技術用語をその同義語に置き換えます。 「人工知能」は「偽の意識」あるいは「偽の脳力」となる。 「クラウドコンピューティング」は「ヘイズ造形」または「蒸気処理」になります。 「ビッグデータ」は「巨大な情報」「膨大なデータ」になります。
慣用的なフレーズの置換 フィールド内のフレーズを置き換えます。 「最先端」は「仕上がりの状態」になります。 「クラス最高」が「クラス最高」になる。 「リアルタイム」は「継続的」または「一定時間」になります。
頭字語の誤った取り扱い。 頭字語は単語であるかのように置き換えられます。 「MRI」は「魅力的共鳴画像法」になります。 「RNA」は「リボ核腐食性」になります。 「JavaScript」は「Java コンテンツ」に断片化されます。
ドメイン固有の置換。 フィールド固有の用語は、別のドメインの同義語に置き換えられます。 「乳がん」は「胸の危険」になる。 「太陽電池」は「太陽電池」になります。 「心臓発作」は「冠不全」になります (これは実際には正しいですが、「心臓発作」が現場の標準用語である文脈での話です)。
通常、文の文法構造は残ります。意味論的な内容は破壊されます。流し読みする査読者はそれらを見逃すかもしれません。ドメインの専門知識を持つレビュー担当者が直ちに通知します。
How they happen
拷問的なフレーズはいくつかの異なるソースから来ています。
同義語置換ツールを使用する製紙工場。 これが 2021 年の調査のきっかけとなった最初の懸念です。製紙工場は、多くの場合、既存の本物の論文を言い換え、その結果得られた「新しい」論文を著者権を購入する研究者に販売することによって、大規模な詐欺論文を生産しています。盗作の検出を回避するために、積極的な同義語置換を通じてソースを実行します。出力は盗作チェックには合格しますが (正確に一致する文字列はありません)、ドメイン専門家のスキャンには合格しません (技術用語が間違っています)。
研究者は無料のオンラインパラフレーズをチェックせずに使用しています。 これは、より一般的な現代の情報源です。英語を母国語としない人、締め切りに追われている学生、または単語数を減らそうとしている人は、無料の言い換えツールを使ってテキストを実行します。このツールはドキュメント全体で同義語を置換します。散文がまだ文法的に読めてしまうため、著者は注意して読んでおらず、分野固有の用語が全体的に間違っている状態で論文を投稿しています。
通常とは異なるプロンプト構成の LLM。 ChatGPT や Claude などの最新の言語モデルは、文脈を理解しているため、言い換えを求められても通常、複雑なフレーズを生成しません。ただし、特定のプロンプト パターンによっては、依然として単語レベルの置換動作がトリガーされる可能性があります。モデルに「これをより多様に書き直す」または「全体で同義語を使用する」ように依頼すると、特にモデルがあまりよく知らない技術的な内容に関して、複雑なフレーズの出力が生成されることがあります。
中間言語を介した翻訳パイプライン。 論文を英語からロシア語、中国語に翻訳して英語 (または同様のチェーン) に戻すと、各翻訳ステップで元の技術用語に再構成されない単語レベルの等価物が置き換えられるため、難解なフレーズ パターンが生成される可能性があります。
研究者を支援した私たちの経験から言えば、不正でない論文で拷問されるフレーズの最も一般的な原因は、第 2 の発生源、つまり悪質な言い換えを使用する無実の研究者です。著者は不正をしようとしているわけではありません。彼らは英語を上達させたり、セクションを短くしたりしようとしています。このツールは、ユーザーに何も言わずに用語を破壊します。
Why they get papers retracted
拷問されたフレーズは現在、製紙工場の関与または未公開の AI 使用の証拠として扱われており、どちらの場合もほとんどのジャーナルで撤回プロセスが引き起こされます。
この推論は過去 2 年間で固まりました。 5、6 年前、奇妙な表現を含む論文が修正された可能性があります。編集者は著者に用語を修正して再出版するよう要求しました。今日では、同じ表現が体系的な問題の番兵として扱われています。基礎となる研究が健全であるとしても、拷問されたフレーズの存在は、著者が論文を購入したか、盗作検出を回避するために攻撃的な言い換えを使用したか、または自分の研究を出版可能な基準に校正しなかったかのいずれかを示唆しています。これらはどれも良い説明ではありません。
特定のジャーナルはこの方針を明示しています。 IEEE、ACM、Elsevier、Springer はすべて、2024 年から 2025 年にかけて編集ガイドラインを更新し、意図の証明を必要とせずに、拷問された表現を撤回の理由として扱うようになりました。 2026 Wiley 編集方針更新では、「製紙工場の関与によるものではなく、文書化された翻訳または編集プロセスから生じた置換を著者が証明できない限り、出版後に発見された拷問的な表現は撤回される」と追加されました。
撤回はまた、それをさらに悪化させる形で著者の評判を傷つけます。撤回された論文は著者の記録に残ります。資金提供機関がチェックします。捜索委員会がチェックする。表現に責任のない共著者は撤回の際にタグ付けされます。ひどい表現は、特にキャリアの浅い研究者にとって、学術的なキャリアを実質的に終わらせる可能性がある数少ない編集上の問題の 1 つです。
How journals are catching them now
The detection ecosystem has matured.
問題のある論文スクリーナー この用語を作ったのと同じチームによって開発されたスクリーナーは、PubMed やその他のデータベースで既知の難解なフレーズを検索する無料のオンライン ツールです。これは、ジャーナルの編集者、査読者、整合性チームが投稿や出版された論文をスキャンするために使用されます。このツールは定期的に更新されるフレーズのリスト (現在 5,000 以上) を管理しており、それらのフレーズを含む論文にはフラグを立てます。
査読前の編集スキャン いくつかの大手出版社 (IEEE、Elsevier、Springer) は、拷問されたフレーズのスキャンを投稿パイプラインに統合しています。提出物は受付時にスキャンされます。ヒットした論文は通常、査読が始まる前に説明を求めて著者に返送されます。
出版後のモニタリング 問題のある論文スクリーナーなどのツールは、すでに出版された論文もスキャンします。ヒットすると、出版社の研究公正チームによる調査が開始されます。調査結果によっては、懸念の表明、訂正、撤回につながる可能性があります。
査読者の意識 査読者は、自分の分野で難解なフレーズを見つけるようますます訓練されています。主要なジャーナルの査読者向けのガイダンスには、現在、「言い換えツールの損傷を示す可能性のある異常な専門用語をスキャンする」ことが明示的に含まれています。
あなたの論文が拷問的な表現のために撤回されることになった場合、通常は出版から 6 ~ 18 か月以内にそのことがわかります。多くの場合、その論文が他の人に引用された後であり、その引用を追跡して通知する必要がある場合、被害はさらに大きくなります。
How to avoid producing them yourself
いくつかの習慣を身につけることで、作品内での難解なフレーズを防ぐことができます。
メソッドや結果のセクション全体を一般的な自由なパラフレーズに貼り付けないでください。 これは最もリスクの高いアクションです。 「独自性」(つまり、盗作検出の回避)に最適化された自由な言い換えは、通常、積極的な同義語置換を使用します。彼らには、どの技術用語が現場標準であり、どの用語が交換可能であるかという概念がありません。出力には技術的な内容の難解なフレーズが含まれます。
技術的な文章を言い換える必要がある場合は、引用を意識した学術的な言い換えツールを使用してください。 言い換えツール のようなツールは、専門分野固有の用語と引用の書式を保持するようにトレーニングされています。分野標準の用語 (「ディープ ラーニング」、「ランダム フォレスト」、「乳がん」、「構造方程式モデリング」) は、書き換え中に維持されます。周囲の散文だけが変わります。
送信する前に、すべての言い換えセクションを読んでください。 具体的には、見慣れない技術用語や、自分が書いていない技術用語がないか調べてください。通常「人工知能」と書くところに「偽造の意識」があれば、それはツールが導入したひどい言葉です。元の用語に戻します。リードスルーと変更追跡 AI 校正者 のパスを組み合わせると、各編集が拒否できる個別の変更として表示されるため、置換を見つけやすくなります。
翻訳されたテキストをソースと照合してください。 AI パイプラインを通じて論文を翻訳した場合は、英語版をスキャンして、ネイティブの分野に適した英語で書く内容と一致しない専門用語がないか調べてください。翻訳パイプラインは、特に盗作を回避するために使用される英語からロシア語から英語へのチェーンの場合、拷問されたフレーズの一般的なソースです。
提出前に問題のあるペーパー スクリーナーを使用してください。 これは無料です。約 30 秒かかります。原稿内の既知の拷問されたフレーズにフラグを立てます。パラフレーズを使用したことがある場合は、提出前の最終ステップとしてこのチェックを実行する価値があります。
「独自性スコア」を品質の代用として信頼しないでください。 高い「独自性」または「独自性」スコアを約束するツールは、通常、難解なフレーズを生成する同義語置換を通じてこれらのスコアを達成します。盗作の検出と優れた文章は同じではありません。分野標準用語を使用したよく引用された文献レビューは、分野標準用語が論文間で共有されているため、中程度の類似性スコアを持つ可能性がありますが、それは問題ありません。
Paraphrase Without Destroying Your Terminology
Our paraphrasing tool preserves technical terms, citations, and meaning. Free tier includes every feature.
Try the Paraphrasing Tool意味論的な言い換えと同義語の置換
あなたの作品を保護する区別は、言い換えに対する 2 つの根本的に異なるアプローチの違いです。
同義語置換 は、ほとんどの無料の言い換えツールで行われます。このツールは文を取得し、単語ごとに同義語を検索して置換します。 「ニューラルネットワークは高精度を達成した」は「ニューラルフレームワークは高精度を達成した」になるかもしれない。出力が受け入れられる場合もあります。多くの場合、それは拷問的なフレーズを生み出します。このツールは、その分野においてフレーズが技術的に正しい理由を理解できません。
意味論的な言い換えは、優れた学術的言い換え者が行うことです。このツールは文章の意味を理解し、現場標準の専門用語を維持しながら文章を書き直します。 「ニューラル ネットワークは高い精度を達成しました」は、「私たちのニューラル ネットワークはベンチマークで高い精度に達しました」になる可能性があります。このツールは「ニューラル ネットワーク」を同義語としてではなく現場標準用語として認識するため、用語が保持されます。
違いは構造的なものであり、表面的なものではありません。意味論的な言い換えに基づいて構築されたツールは、医療領域のコンテキストを認識するため、「乳がん」を保存します。同義語置換ツールは、これを「胸の危険」に置き換えます。単語レベルでは、「胸」と「危険」は辞書で「乳房」と「がん」の同義語であるためです。
通常、言い換えツールがどのアプローチを使用しているかは、専門用語が多く含まれる段落でテストすることでわかります。メソッド セクションをツールに貼り付けます。出力を読みます。専門用語が生き残っている場合 (ディープ ラーニング、ランダム フォレスト、構造方程式モデリング、乳がん)、ツールは意味論的な言い換えを使用しています。新しいフレーズ (深い学習、不規則な森林地帯、主要な状態の実証、懐の危険) が表示された場合、このツールは同義語置換を使用しているため、学術的な内容には使用しないでください。学術レベルの言い換えに何を求めるべきかについて詳しくは、引用を保存する言い換えツール の比較をご覧ください。
Citation-aware academic paraphrasing that preserves technical terminology. Free tier includes every feature.
Frequently asked questions
Q: 提出する前に、自分の論文に拷問的な表現が含まれているかどうかを確認するにはどうすればよいですか?
問題のあるペーパー スクリーナー (Cabanac et al. プロジェクト サイトで無料) を通して実行します。このツールは、5,000 を超える既知の拷問フレーズのリストと照らし合わせて原稿をチェックします。ヒットには修正された用語のフラグが付けられます。また、その分野の通常の語彙と一致しない専門用語を論文内で手動で検索することもできます。原稿で無料の言い換えツールを使用した場合、最もリスクの高いセクションは通常、技術用語が最も密集している手法と結果です。
Q: 提出した論文に拷問的な表現が含まれていることに気付いた場合はどうすればよいですか?
査読が結論づく前に、編集者へすぐに連絡してください。何が起きたのか(置換が生じたのは、パラフレーズ用のツールを使用したためです)を説明し、修正済みの原稿を提出してください。編集者は、事前の自己申告と、後から偶然発覚した場合とでは、一般にまったく異なる対応をします。多くの場合、問題が別ルートで独自に検出される前に対応すれば、修正版としての再提出を受け入れてもらえます。論文がすでに出版されている場合は、ジャーナルの研究不正対応(リサーチ・インテグリティ)窓口に連絡して、訂正(コレクション)を依頼してください。あなたが早く行動するほど、正式なリトラクション(撤回)の可能性は低くなります。
Q: ChatGPT や Claude のような LLM は言い換えに安全に使用できますか?
最新の LLM は一般に、コンテキストを理解しているため、専門用語を保持する点で専用の無料パラフレーズよりもはるかに優れています。しかし、彼らは拷問的な言葉に無縁ではありません。特定のプロンプト パターン (「同義語を使用する」、「多様性を持たせるために書き直す」、「よりユニークにする」) によって、単語レベルの置換動作がトリガーされることがあります。言い換えに LLM を使用する場合は、「すべての技術用語と引用の形式を保持する」ことを明示的に要求し、常に出力をソースと照合して検証してください。出版可能な原稿で一か八かの言い換えを行う場合は、一般的な LLM プロンプトよりも引用を意識した学術的言い換えの方が安全です。
Q: 問題のあるペーパー スクリーナーはどのようにして最新の状態に保たれますか?
その背後にあるチーム (トゥールーズ大学のギョーム・カバナックが率いる) は、撤回されフラグが立てられた論文の法医学的分析から収集した語句の公開リストを管理しています。コミュニティは新しい発見に貢献します。製紙工場が置換パターンを進化させるにつれて、新しいフレーズが追加されます。現在、リストのエントリ数は 5,000 を超えており、毎月増加しています。自分の分野でリストに載っていない難解なフレーズを発見した場合は、それを投稿することができます。コミュニティが分野固有の用語を追加するにつれて、スクリーナーはさらに便利になります。

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.