\"Tortured Phrases\": Why Bad Paraphrasers Get Papers Retracted
Why \"counterfeit consciousness\" used to mean AI in published papers, how tortured phrases get research retracted, and how to use a paraphrasing tool that doesn't produce them.
2021 年,位于图卢兹的一个研究诚信团队发布了一系列曾出现在计算机科学论文中但不太有意义的短语。 “伪造意识。” “雾霾计算。” “学问深厚。” “不正常的尊重。” “胸部危险。”每一个都是一个真实技术术语的同义词库替代版本——人工智能、云计算、深度学习、随机值、乳腺癌。使用它们的论文已经通过了抄袭检查,但没有引起任何人类读者的注意。
团队为这些替换操作起了一个名字:tortured phrases(“折磨式措辞”)。原始论文将其追溯到改写工具——既包括纸业工厂用来规避抄袭检测的手动工具,也包括一些研究人员在自己的作品中使用的自动化工具。该发现引发了一波撤稿潮,并且持续到2026年。根据最新统计,截至目前已有超过1,400篇已发表论文被撤稿,或因遭受“折磨式措辞”污染而被标记,其中主要集中在工程、计算机科学和生物医学等领域。
本指南解释了什么是折磨短语、它们是如何产生的、为什么它们结束职业生涯并撤回论文、期刊现在用来检测它们的工具,以及如何确保您自己的释义工作流程不会产生它们。
What tortured phrases are
饱受折磨的短语是一种公认的技术术语,已被同义词替换的等效术语所取代——通常语法上完整,但语义上对于该领域的任何人来说都是无意义的。这种转换通常逐字进行,而不考虑生成的短语是否是领域专家会说的内容。
2021 年原始研究中的一个经典例子:在一篇关于“不规则林地”(随机森林)的论文中,作者讨论了模型的“高精度”,但没有注意到他们还写了“边界树”(决策树)和“管理拾取”(监督学习)。从某种意义上说,这篇论文的技术内容是真正的研究——但散文是由一个不知道这些术语含义的工具处理的。
A typology of how they appear:
单个术语替换。 常用技术术语替换为其同义词。 “人工智能”变成了“假意识”或“假脑力”。 “云计算”变成“雾霾计算”或“蒸汽处理”。 “大数据”变成“巨大的信息”或“巨大的数据”。
惯用短语替换。 替换字段中的设置短语。 “最先进的技术”变成了“工艺条件”。 “同类最佳”变成“同类理想”。 “实时”变为“持续”或“恒定时间”。
**首字母缩略词处理不当。**首字母缩略词被替换,就像它们是单词一样。 “MRI”变成“有吸引力的共振成像”。 “RNA”变成“核糖核酸腐蚀剂”。 “JavaScript”被分割成“Java 内容”。
特定于域的替换。 特定于域的术语被替换为来自不同域的同义词。 “乳腺癌”变成“胸部危险”。 “太阳能电池”变成“基于太阳的电池”。 “心脏病发作”变成“冠状动脉衰竭”(这实际上是正确的,但在“心脏病发作”是现场标准术语的情况下)。
句子的语法结构通常会保留下来。语义内容被破坏。审稿人浏览时可能会错过它们;具有领域专业知识的审阅者会立即注意到。
How they happen
折磨人的短语有几个不同的来源。
造纸厂使用同义词替换工具。 这是促成 2021 年研究的最初担忧。造纸厂大规模生产欺诈性论文,通常是通过解释现有的真实论文并将所得的“新”论文出售给研究人员购买作者权。为了逃避抄袭检测,他们通过积极的同义词替换来运行源代码。输出通过了抄袭检查(没有精确的字符串匹配),但未通过任何领域专家的扫描(技术术语是错误的)。
**研究人员在没有检查的情况下使用免费的在线释义。**这是更常见的现代来源。非英语母语人士、面临截止日期压力的学生或任何试图减少字数的人都通过免费的释义工具来运行他们的文本。该工具会替换整个文档中的同义词。作者没有仔细阅读,因为散文读起来仍然符合语法,并且提交了一篇论文,其中的特定领域术语现在通篇都是错误的。
采用不寻常的提示配置的法学硕士。 现代语言模型(如 ChatGPT 和 Claude)在被要求释义时通常不会产生令人痛苦的短语,因为它们理解上下文。但某些提示模式仍然可以触发单词级替换行为。要求模型“用更多的多样性重写它”或“始终使用同义词”有时会产生令人痛苦的短语输出,特别是在模型不太了解的技术内容上。
通过中间语言的翻译管道。 将论文从英语翻译成俄语,再翻译成中文,再翻译成英语(或任何类似的链)可能会产生令人痛苦的短语模式,因为每个翻译步骤都会替换不会重新组合成原始技术术语的单词级等效项。
根据我们帮助研究人员的经验,第二个来源——无辜的研究人员使用糟糕的释义——是非欺诈性论文中出现折磨短语的最常见原因。作者并不是想作弊;他们正在努力提高英语水平或缩短某个部分。该工具在没有告诉他们的情况下破坏了他们的术语。
Why they get papers retracted
受折磨的短语现在被视为造纸厂参与或未公开的人工智能使用的证据,这两者都会触发大多数期刊的撤回程序。
在过去的两年里,这种推理变得更加坚定。五六年前,一篇措辞奇怪的论文可能会被纠正——编辑会要求作者修改术语并重新发表。如今,同样的措辞被视为系统问题的哨兵。即使基础研究是合理的,受折磨的短语的存在表明作者要么购买了这篇论文,使用了激进的释义来逃避抄袭检测,要么没有按照可出版的标准校对自己的作品。这些都不是很好的解释。
具体期刊已经明确了该政策。 IEEE、ACM、Elsevier 和 Springer 均已在 2024-2025 年更新了编辑指南,将受折磨的短语视为撤回理由,而无需提供意图证明。 2026 年 Wiley 编辑政策更新补充说,“出版后发现的受折磨的短语将导致撤回,除非作者能够证明替换是由记录的翻译或编辑过程而不是造纸厂的参与造成的。”
撤稿还以多种方式损害了作者的声誉。撤回的论文保留在作者的记录中。资助机构检查。搜寻委员会进行检查。不负责措辞的合著者会在撤回中被标记。受折磨的短语是为数不多的可能结束学术生涯的编辑问题之一,特别是对于早期职业研究人员而言。
How journals are catching them now
The detection ecosystem has matured.
有问题的论文筛选器。 该筛选器由创造该术语的同一团队开发,是一款免费的在线工具,可以在 PubMed 和其他数据库中搜索已知的折磨短语。期刊的编辑、同行评审员和诚信团队使用它来扫描提交的内容和已发表的论文。该工具维护定期更新的短语列表(目前超过 5,000 个),并标记包含它们的任何论文。
同行评审前的编辑扫描。 几家主要出版商(IEEE、Elsevier、Springer)已将扭曲短语扫描集成到其提交流程中。提交的材料在受理时进行扫描。在同行评审开始之前,点击率较高的论文通常会被退回给作者,并要求其做出解释。
发表后监控。 像问题论文筛选器这样的工具也会扫描已经发表的论文。点击率会引发出版商研究诚信团队的调查。调查可能会导致表达关注、更正或撤回,具体取决于调查结果。
审稿人意识。 同行审稿人越来越多地接受培训,以发现自己领域中令人痛苦的短语。主要期刊的审稿人指导现在明确包括“扫描可能表明释义工具损坏的不寻常的技术术语”。
如果您的论文因受折磨的短语而被撤回,您通常会在发表后 6-18 个月内发现——通常是在论文被其他人引用之后,当需要跟踪和通知这些引用时,这会加剧损害。
How to avoid producing them yourself
一些习惯可以防止你的工作中出现令人痛苦的短语。
**不要将整个方法或结果部分粘贴到通用的免费释义器中。**这是风险最高的操作。针对“独特性”(即逃避抄袭检测)进行优化的免费释义器通常使用积极的同义词替换。他们不知道哪些技术术语是现场标准的,哪些是可以互换的。输出将包含技术内容中令人痛苦的短语。
如果您必须释义技术文本,请使用具有引文意识的学术释义器。 我们的释义工具 等工具经过培训,可以保留特定学科的术语和引文格式。领域标准术语——“深度学习”、“随机森林”、“乳腺癌”、“结构方程建模”——在重写过程中被保留。只是周围的散文发生了变化。
**提交前阅读每个释义部分。**具体来说,扫描任何看起来不熟悉或您没有写过的技术术语。如果你在通常写“人工智能”的地方看到“假意识”,那么这是该工具引入的一个折磨人的短语。恢复原来的术语。将通读与跟踪更改 AI 校对器 配对,可以更轻松地发现替换,因为每个编辑都显示为您可以拒绝的离散更改。
根据来源检查翻译文本。 如果您通过任何人工智能管道翻译了一篇论文,请扫描英文版本,查找与您用适合您的母语领域的英语所写内容不匹配的技术术语。翻译管道是备受折磨的短语的常见来源,特别是对于用于逃避抄袭的英语到俄语到英语的连锁店。
提交前使用问题论文筛选器。 它是免费的。大约需要 30 秒。它会标记您手稿中任何已知的受折磨的短语。如果您使用过释义器,则值得将这项检查作为最后的提交前步骤运行。
**不要相信“独特性分数”作为质量的代表。**承诺高“原创性”或“独特性”分数的工具通常通过产生痛苦短语的同义词替换来实现这些分数。抄袭检测和优秀的写作不是一回事。具有领域标准术语的被广泛引用的文献综述可能具有中等的相似性分数,因为领域标准术语在论文之间共享——这很好。
Paraphrase Without Destroying Your Terminology
Our paraphrasing tool preserves technical terms, citations, and meaning. Free tier includes every feature.
Try the Paraphrasing Tool语义释义与同义词替换
保护您的作品的区别在于两种根本不同的释义方法之间的差异。
同义词替换是大多数免费释义工具所做的事情。该工具接受一个句子,逐字查找同义词,然后替换它们。 “神经网络实现了高精度”可能会变成“神经框架实现了高精度”。有时输出是可以接受的;它常常会产生令人痛苦的短语。该工具无法理解是什么使得短语在您的领域中在技术上是正确的。
语义释义是优秀的学术释义者所做的事情。该工具理解句子的含义并重写它,同时保留现场标准的技术术语。 “神经网络达到了高精度”可能会变成“我们的神经网络在基准测试中达到了高精度”。该术语被保留,因为该工具将“神经网络”识别为现场标准术语,而不是要同义词的短语。
差异是结构性的,而不是表面性的。基于语义释义构建的工具将保留“乳腺癌”,因为它可以识别医学领域的上下文。同义词替换工具会将其替换为“bosom peril”,因为在单词级别,“bosom”和“peril”是“breast”和“cancer”的字典同义词。
通常可以通过在一段充满技术术语的文字上测试,来判断释义工具采用的是哪种方法。把一段方法章节粘贴到工具中,然后阅读输出结果。如果原有的技术术语仍然保留下来(deep learning、random forest、structural equation modeling、breast cancer),说明该工具在使用语义释义。如果你看到的是一些新造的说法(profound learning、irregular timberland、primary condition demonstrating、bosom peril),则表明该工具使用的是同义替换,且不应将其用于学术内容。想了解学术级释义器需要重点关注哪些方面,请参阅我们对保留引文的释义工具的比较。
Citation-aware academic paraphrasing that preserves technical terminology. Free tier includes every feature.
Frequently asked questions
问:在提交之前如何判断我的论文是否存在扭曲的短语?
通过 Problematic Paper Screener(在 Cabanac 等项目网站免费)运行它。该工具会根据 5,000 多个已知的折磨短语列表检查您的手稿。命中会用更正的术语进行标记。您还可以手动搜索论文中与该领域常用词汇不匹配的任何技术术语。如果您在手稿上使用了免费的释义工具,那么风险最高的部分通常是方法和结果,其中技术术语最密集。
问:如果我发现我提交的论文中有折磨人的短语,我该怎么办?
在同行评审结束之前立即联系编辑。解释发生了什么(您使用了引入替换的释义工具)。提供更正的手稿。编辑通常对待主动披露与事后发现有很大不同。如果您在独立检测到问题之前采取行动,大多数人都会接受更正后的重新提交。如果论文已经发表,请联系期刊的研究诚信办公室请求更正。越早采取行动,正式撤回的可能性就越低。
问:像 ChatGPT 和 Claude 这样的法学硕士可以安全地用于释义吗?
现代的大型语言模型(LLM)通常比专门的免费改写器更擅长在改写过程中保留技术术语,因为它们理解上下文。尽管如此,它们也并非不会出现“拗口”的表述。特定的提示模式("use synonyms," "rewrite for variety," "make it more unique")可能会触发逐词层面的替换行为。如果你要使用 LLM 进行改写,请明确要求它“preserve all technical terminology and citation formatting”,并始终将输出与原文进行核对。对于用于可发表稿件的高风险改写,具备引文感知能力的学术改写器要比通用的 LLM 提示更安全。
问:有问题的纸张筛选器如何保持最新状态?
其背后的团队(由图卢兹大学的纪尧姆·卡巴纳克(Guillaume Cabanac)领导)维护着一个开放的短语列表,该列表是从对撤回和标记的论文的取证分析中收集的。社区贡献了新的发现。随着造纸厂不断发展其替代模式,新的短语不断添加。该列表目前超过 5,000 个条目,并且每月都在增长。如果您在自己的领域发现了一个不在列表中的折磨短语,您可以贡献它 - 随着社区添加特定领域的术语,筛选器变得更加有用。

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.