How to Polish a Preprint Before Posting to arXiv / bioRxiv / SSRN
A practical guide to polishing a preprint before posting to arXiv, bioRxiv, medRxiv, or SSRN. What to check, server-specific conventions, and why pre-posting editing matters more than authors usually think.
去年,bioRxiv 上发布的一份计算生物学预印本在第一周就获得了 4,000 次阅读,随后进入《Nature》新闻简报,并在同行评审后的版本发布(八个月之后)之前就被引用了 14 次。来自同一实验室的另一篇预印本也几乎在同一时间发布,阅读量只有 200 次,既没有媒体报道,也没有引用。两者的科研内容相当。该实验室的通讯作者在事后告诉我们,关键差别在于:第一篇预印本在发布前已先被三位课题组成员认真阅读;而第二篇预印本则是在完成草稿的当晚就被直接上线发布。
这就是 2026 年预印本权重不足的现实:预印本通常是论文中阅读次数最多的版本。大多数读者没有机构访问该期刊版本的权限。许多人从未见过它。您的预印本是您的公共记录——可引用、可索引、发布后及时冻结。事后修复方法将预印本视为草稿。读者将其视为作品。
本指南涵盖了发布前要检查的内容、arXiv、bioRxiv、medRxiv 和 SSRN 的服务器特定约定、为什么语言润色比作者通常认为的更重要,以及生成您愿意引用的预印本的编辑工作流程。
为什么预印本质量比以前更重要
预印本文化已经发生了变化,提高了您发布内容的风险。
**预印本现在是可见版本。**十年前,预印本是分发给专业受众的草稿。如今,它们已被 Google Scholar 编入索引,被科学 Twitter 和 Bluesky 收录,由人工智能驱动的研究助理进行总结,并在同行评审版本出现之前在其他预印本中被引用。您的预印本吸引了读者,他们将仅根据它对您的作品形成意见。
版本控制是公开的。 当您发布带有更正的版本 2 时,版本 1 保留在服务器上。任何人都可以比较。带有令人尴尬的错误的版本1将被永久记录。版本 2 中的修复值得赞赏;版本 1 首先需要修复的事实也被记住了。
人工智能摘要员正在接受预印本培训。 Elicit、Consensus 和各种人工智能驱动的文献助手等工具从预印本服务器中提取。措辞混乱或主张不明确的预印本的总结会令人困惑。该摘要比原始内容传播得更远,并且更难纠正。
职业信号。 遴选委员会和拨款评审员将预印本输出视为候选人记录的一部分。一篇文字有力、表述清晰的预印本所传达的信息与匆忙发布的预印本不同。即使没有人大声说出来,这种效果也是真实存在的。
撤稿观察和出版后评论。 批判性读者发布了他们认为相关的预印本的详细分析。 PubPeer 主题、Twitter 剖析和撤稿观察报道现在都发生在预印本阶段,有时是在同行评审之前几个月。一份经过精心打磨、能够引起认真参与的预印本与引起公众修正的预印本是不同的。
综合影响:发布粗略预印本的成本上升了;额外花费几个小时进行打磨的成本保持不变。数学已经转向波兰。
What to check before posting
上传前最后 2-3 小时的清单。
作者列表和顺序。 验证每个作者都以正确的顺序正确列出,并具有正确的隶属关系。通过电子邮件向每位作者发送最终版本并确认他们批准发布。发布后作者身份发生变化需要版本更新并造成混乱。
隶属关系和 ORCID ID。 每个作者的隶属关系应与他们在发表的论文中想要的内容相匹配。 ORCID ID 应在作者拥有的地方填写。该元数据通过谷歌学术和引文系统传播。
**资金和利益冲突声明。**将其包含在预印本中。资助声明帮助读者了解工作的背景;即使在预印本阶段,人们也越来越期待冲突声明。
人工智能使用披露。 如果您在起草、编辑或分析中使用人工智能工具,请附上披露声明。适用于期刊提交的相同模板适用于预印本阶段 - 我们的人工智能使用披露指南 涵盖了该语言。公开的人工智能使用与后来发现的未公开的人工智能使用的处理方式非常不同。
代码和数据可用性。 说明代码所在位置(GitHub、GitLab、Zenodo)以及如何访问数据。 “按需提供”越来越被认为是不够的;具体的 URL 或存储库名称是约定。对于某些领域,发布没有代码/数据链接的预印本会降低可信度。
许可证选择。 慎重选择许可证。 CC BY 允许重复使用并注明归属; CC BY-NC 限制商业重复使用; arXiv 的默认许可证比许多作者意识到的限制更多。您选择的许可证会影响其他人是否可以在他们的作品中包含您的预印本中的数据、公司是否可以在此基础上进行构建、您以后是否可以按照自己的版权要求在期刊上重新发表。
参考文献。 每个引用的参考文献都会解析。对于未解决的引用,编译后的 PDF 中没有“?”标记。参考书目中的参考文献格式一致。
**图和表。**文中引用的所有图。引用的所有表格。图标题充分描述了读者单独查看该图所显示的内容。表格标题清晰。数字中的字体大小在打印分辨率下清晰可见。
语言通行证。 仔细的校对通行证,最好通过人工智能校对员 跟踪更改。预印本没有像期刊上的文案编辑那样进行语言润色,因此您发布的版本就是读者看到的版本。
最终 PDF 检查。 生成您要上传的 PDF。打开它。阅读第一页。滚动查看数字是否正确呈现、方程是否正确显示、引文是否解析。读者下载的 PDF 就是工件;发布前验证一下。
Server-specific conventions
四大服务器有着不同的文化和惯例。
arXiv. 最古老、规模最大,在物理、数学和计算机科学领域占主导地位,在定量生物学和经济学领域不断发展。某些学科领域的首次提交者需要现有 arXiv 作者的认可。主要主题分类对于可见性非常重要 - 您的论文出现在其主要主题的每日列表中,并且正确的分类会吸引正确的受众。许可证选项有利于保留:arXiv 的默认许可证比某些作者选择的永久非独占选项更宽松。选择之前请阅读许可页面。
arXiv 期望 LaTeX 提供数学密集型提交的来源。允许仅提交 PDF,但 arXiv 的渲染效果较差。如果您的论文位于 LaTeX 中,请上传源文件,而不仅仅是 PDF。
bioRxiv. 成立于 2013 年,在分子生物学、细胞生物学、神经科学以及日益广泛的生命科学领域占据主导地位。有自己的审核流程——提交的内容将在 1-3 个工作日内进行基本适用性审核(来自真实作者的真实研究,而不是伪科学)。分类(遗传学、神经科学、细胞生物学等)会影响 bioRxiv 主页和电子邮件警报中的可见性。 bioRxiv 鼓励但不要求代码和数据链接。
2024 年的一项调查发现,约 70% 的 bioRxiv 预印本最终出现在同行评审期刊中。另外 30% 仅保留在 bioRxiv 上,这意味着预印本可能是您作品的永久出版形式。
medRxiv. 成立于2019年,专注于健康科学和临床研究。审核比 bioRxiv 更保守——预印本使临床主张(干预、治疗、公共卫生建议)得到更仔细的审查。某些声明类型仅限于具有临床资格的作者。 COVID-19 时代显着扩大了 medRxiv 的作用;它现在比任何其他服务器托管更多的临床相关预印本。
medRxiv 要求有关道德批准、冲突和数据可用性的声明,而许多其他预印本服务器并不强制执行。仔细阅读提交要求。
SSRN. 成立于1994年,专注于社会科学、经济、法律和人文学科。该类别系统被读者大量使用——正确的 SSRN 类别中的论文会通过电子邮件发送给该类别的订阅者,这可以大大增加早期浏览量。许多顶级经济学和金融论文在其生命周期的早期就发布到 SSRN 上。法律评论越来越多地仅在 SSRN 发布后接受提交,将预印本视为规范版本。
SSRN 于 2016 年被 Elsevier 收购,这引起了一些用户对未来许可变更的担忧。当前的条款仍然对作者友好,但请注意所有权。
特定领域的服务器。 chemRxiv(化学)、EarthArXiv(地球科学)、PsyArXiv(心理学)、AgriRxiv(农业)和其他服务于特定学科。这些约定往往遵循最接近的学科通用服务器(生命科学为bioRxiv,定量领域为arXiv)。查看具体服务器的提交指南。
Polishing workflow
无需过度设计流程即可生成干净预印本的序列。
第 1 步:自行编辑。 从头到尾阅读论文。修复明显的问题。检查论证是否如你所愿。这是物质与结构的关卡;编辑工具稍后推出。
第 2 步:运行语言编辑阶段。 通过 AI 校对器 以标准编辑深度粘贴您的散文块。对于 LaTeX,请使用我们的 LaTeX/Overleaf 工作流程 中的占位符方法,以避免破坏数学或引用。查看跟踪的更改并有选择地接受。
第 3 步:共同作者审阅。 将完善的草稿发送给所有共同作者。在 24-48 小时内收集反馈。这是在截止日期压力下最常被跳过的步骤,也是发布后最常后悔的步骤。
第 4 步:飞行前检查清单。 仔细检查上面的“发布前要检查的内容”列表。每个项目都经过明确验证,而不是假设。
第 5 步:最终编译和 PDF 审核。 生成上传 PDF。打开它。仔细阅读第一页和摘要。快速滚动以验证图形和表格是否正确呈现。
第 6 步:使用正确的元数据上传到正确的服务器。 主题分类、许可证选择、摘要粘贴、补充文件上传。元数据是读者找到您的依据;做对事情很重要。
第 7 步:观察前 48 小时。 大多数预印本在发布后的前 48 小时内会出现最初的可见度激增。如果您在此窗口中发现问题,请快速发布版本 2。后来发现的问题变得更加复杂(已经引用,已经讨论)并且变得更加难以解决。
对于一篇典型的论文,此工作流程需要 4-8 个小时的工作时间,分布在 2-5 天内,具体取决于共同作者的可用性。比期刊提交过程要短得多——但这种简短是它被跳过的部分原因,也是预印本经常看起来很匆忙的原因之一。
Polish Your Preprint Before You Post It
Tracked-changes editing on the version your readers will actually see. Free tier includes every feature.
Try the AI ProofreaderVersioning and updates
发布后,您通常需要至少更新一次。常见原因:
来自期刊的审稿人反馈。 当您的论文经过同行评审时,修改会对其进行改进。使用修订版本更新预印本。大多数服务器都能很好地处理版本控制 - 版本 1 保持可访问,版本 2 成为默认值。
读者发现的错误。 读者通过电子邮件向您报告拼写错误、错误引用或他们认为不正确的分析。实质性更正需要版本 2,并简要说明更改内容。
代码或数据更新。 通常,论文是稳定的,但代码存储库会不断发展。当存储库发生有意义的变化(新版本、新依赖项、新数据集)时更新预印本。
期刊接受。 论文被接受后,在元数据中发布包含期刊名称和 DOI 的版本。这有助于跟踪引文并确保读者获得最新版本。
当您发布版本 2 时,请写一份简短的更改说明,解释有何不同。这是对比较版本的读者的礼貌,并有助于确定这些更改是改进而不是实质性重写。
不要发布版本 3、4、5、6。如果您更新得那么频繁,那么预印本可能一开始就没有准备好发布。最好等待下一个实质性改进,而不是通过小更新来蚕食预印本。
When not to post a preprint
在某些情况下,等待是正确的选择。
科学确实不完整。 如果您需要再进行三周的实验才能做出强有力的主张,请先进行实验。具有弱声明的预印本将成为弱声明的永久记录。
共同作者尚未批准。 未经共同作者明确批准而发布的内容会损害未来合作中的信任。
**目标期刊禁止预印本。**少数且数量不断减少的期刊仍然禁止预印本(一些临床医学期刊,一些人文学科期刊)。发帖前请检查期刊的政策。
您的 IRB 或研究伦理批准不涵盖预印本发布。 一些 IRB 批准指定可以在何处共享结果。在发布之前验证您的作品是否涉及人类主题。
**你被抢先了,发布实际上并没有什么帮助。**有时正确的做法是专注于提交而不是预印本发布。如果竞争对手刚刚发表了类似的发现,那么仓促预印本的发布日期对你的优先权主张没有帮助。
在大多数情况下,发布是正确的选择。发布前的润色决定了预印本是否适合您的工作或不利于您的工作。
Tracked-changes editing for preprints, manuscripts, and conference papers. Free tier includes every feature.
Frequently asked questions
问:发布预印本是否会影响我在期刊上发表文章的机会?
对大多数期刊来说,不是这样。绝大多数主要期刊(覆盖 STEM、社科与人文领域)现在都会明确允许预印本,且许多期刊还会主动鼓励预印本。有一小部分期刊(少数临床医学期刊、以及一些法学期刊)仍然限制预印本——在投稿前务必查看该期刊的具体政策。部分期刊还有关于“哪一个预印本版本将成为正式发表版本(version of record)”的附加规则,请仔细阅读。到 2026 年为止,一个默认前提是预印本被允许,并且常常会被鼓励,但仍请针对你的目标期刊进行核实。
问:预印本和期刊提交之间应该等待多长时间?
您可以在发布预印本的同一天向期刊提交。无需等待期。这两个进程是独立的。预印本上涨;期刊提交开始同行评审。当期刊接受并出版时,您可以使用期刊 DOI 更新预印本。一些作者喜欢在预印本发布后等待几天,以评估最初的接受程度,然后再提交,但这是偏好而不是要求。
问:我应该回复预印本上的评论吗?
如果评论是实质性的——指出错误、提出方法论问题、建议进行额外的分析——是的,参与。这种参与是预印本文化如何发挥作用并在同行评审之前改进论文的一部分。如果评论不受支持、充满敌意或偏离主题,则没有义务参与——预印本评论线程可能会引起噪音,你的时间最好花在论文本身上。您在发表实质性评论后发布的版本 2 表现出了诚意,并且常常使论文更加有力。
问:如果我在发布后发现预印本中有错误怎么办?
发布版本 2 并进行更正。包括一个简短的更改说明,解释修复的内容和原因。如果错误足够严重以至于原始声明不再成立,则变更注释应直接说明。快速确认和纠正受到社区的良好对待;悄悄编辑或假装错误不存在会受到不好的对待。对于导致论文无效的严重错误,撤回有时是适当的——大多数服务器都有撤回流程,尽管撤回的版本通常仍然可以通过通知访问。

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.