AI成就论文工厂?一天两篇SCI,论文批量造假!Science:92%来自中国
作者:微信文章如果你是一个科研期刊的编辑,每天打开邮箱,扑面而来的不是新思想的火花,而是一堆格式整齐、主题雷同、措辞流畅却空洞乏味的论文。乍一看,它们似乎符合所有学术写作的技术标准:有引言、有方法、有统计显著性,但当你审读第五篇、第十篇甚至第五十篇时,心中可能只剩下一个疑问:这真的是“科研”吗?
这不是科幻小说,而是真实发生在国际期刊编辑Matt Spick身上的故事。他在《Scientific Reports》工作期间,接连收到一批又一批基于NHANES(美国国家健康与营养调查)数据库撰写的研究论文。形式相似、结构如出一辙,最多一天两篇,仿佛有人在批量化生产“学术产品”。2024年,单是基于这个公共数据集的论文产量就高达7876篇,而2014年时这一数字不到200篇。
原文链接:
https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai
这个现象只是“冰山一角”。另一端,生成式AI正以前所未有的速度进入科研流程,从生成假设、数据分析,到论文撰写、甚至同行评审,AI无处不在。一些期刊甚至已尝试用大语言模型(LLM)来协助审稿,一名作者只需用语音录入审读感受,AI便可在30分钟内生成一份完整审稿意见。曾被视为科研“守门人”的审稿人,也正悄然成为这场自动化浪潮的“被替代者”。
原文链接:https://www.reddit.com/r/singularity/comments/1lskxpg/academia_is_cooked/
这就是我们所处的时代:一个AI工具日益普及、论文产出井喷、科研伦理遭遇挑战的临界点。而将这些要素联系在一起的,是一个深层问题:当科学变成流水线,当人类判断被外包给机器,我们是否正站在科研崩塌的边缘?
(一)一场以“科学”为名的工业革命——垃圾论文的批量化生产
Matt Spick将这种现象称为“科研填空游戏”——选择一个健康变量(如维生素D)、一个疾病结果(如抑郁症),套用标准的logistic回归模型,再控制三五个协变量,输出一个“显著相关”的结论,一篇“SCI论文”就此诞生。若把变量互换位置、换个群体、换段数据年份,又是新论文一篇。
这类论文的爆发式增长,几乎完全归功于几个关键要素的“协同高效”:
AI工具:ChatGPT等生成式模型能快速润色论文语言,甚至直接生成摘要、方法与讨论部分;
公共数据库:如NHANES、GBD、UK Biobank等,提供结构化、标准化的数据集,几乎无需实地实验;
自动化脚本:R语言与Python中的一系列包(如nhanesA, pynhanes)可实现变量提取、数据清洗、统计建模与结果可视化一条龙处理;
付费发表机制:开放获取期刊普遍收取1000美元左右的发表费,为这场“学术工业革命”提供了直接商业激励。
这套流程的最终产物是“显著”但缺乏科学意义的结论。Spick团队分析28篇以抑郁症为结局的NHANES论文,发现其中15篇在进行错误发现率(FDR)校正后不再显著,意味着这些所谓的“发现”可能只是统计噪音。更甚者,一些作者会有选择地只使用部分年份的数据、特定人群子集,以达到筛选出最“漂亮”p值的目的——这被称为“p值狩猎”。
原文链接:
https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3003152
在这种“学术工业模式”下,科学问题不再以理论为核心,而是沦为变量排列组合的结果。研究者变成了操作工,论文变成了产品,学术期刊则仿佛是流水线末端的包装车间。
(二) 中国科研生态的集体浮躁——为什么92%的垃圾论文来自中国?
在Matt Spick团队收集的341篇NHANES“套路论文”中,有超过92%的第一作者来自中国机构。这一比例之高令人震惊,也发人深省。
这并不是因为中国学者在数据分析上独树一帜,而是科研激励机制使然。在中国,高校职称晋升、项目申请、研究生毕业、医院评优评先几乎都离不开论文数量。“有没有SCI”、“中了没”、“发了几篇”,这些词汇构成了基层科研人员最日常的生存语言。
于是,一条完整的“论文工厂”产业链应运而生:
选题代写平台:提供公共数据库挖掘服务,宣传“数据组合法发表率更高”;
统计分析外包:脚本自动生成,跑模型、调p值、筛变量一站式完成;
英文润色与格式指导:ChatGPT或其他AI工具生成文稿,语言“无可挑剔”;
投稿代投机构:擅长匹配开放获取期刊,并协助处理审稿意见。
在社交媒体上搜索“NHANES 数据 挖掘 SCI”,能看到大量平台打出“陪跑服务”、“全流程定制”等广告。某平台甚至直言不讳:“我们提供的统计服务可不断更换研究主题,挖掘数据,直至分析出发表级结果。”这是在说——不管科学有没有意义,只要p值能“过线”,论文就能送审。
而这些论文中的大多数,正是Spick等人眼中的“AI + 数据拼图”的产物。
这不仅仅是学术的沉沦,更是科研伦理的系统性塌方。
(三) 同行评审的灵魂之问——AI可否替代审稿人?
当一篇篇“看上去没毛病”的AI流水线论文如潮水般涌入期刊,学术界的第一道防线——同行评审系统,也正面临严重的考验。
2025年6月,《Nature》刊登了一篇由华盛顿大学进化生物学家Carl T. Bergstrom与数字传播研究者Joe Bak-Coleman联合撰写的文章。这篇文章犹如一记警钟,直指当前科学界对AI审稿工具的盲目信赖可能正在“毁掉科研的灵魂”。
原文链接:
https://www.nature.com/articles/d41586-025-01839-w
在他们看来,真正的同行评审,远非“读一遍论文、写点评价”那么简单。一个负责任的审稿人会反复研读稿件,理解其整体逻辑,检索相关文献,甚至动手复现图表、分析代码,然后在一个高度结构化的审稿报告中完成对文章的系统反馈——从优点到缺陷,从关键问题到可忽略瑕疵。
而AI呢?它可以根据初步提示迅速总结段落、生成术语准确的评价语句,甚至模仿人类写作风格完成一份“像模像样”的评审报告。但这真的代表了“同行评审”吗?
Bergstrom指出:AI没有人类的判断能力、研究经验、价值取向、伦理认知,更不会与编辑或作者产生真实互动。一个学者在评审时可能会因为某个逻辑漏洞引发自己对研究范式的反思,也可能在查证过程中发现隐藏的假设错误。评审的过程,不只是服务于期刊,也是学者自我思考的过程。而AI输出的,只是一次格式化的语言仿真。
更危险的是,当我们将“评审”简化为一个可以用AI自动完成的任务时,也许我们正在默许这样一个新现实:我们不再需要真正的判断力,只要一个“听起来合理”的报告即可。
这恰恰是AI时代最大的问题:当看上去合理的语言生成结果取代了基于理解与思辨的判断力,整个科研系统将陷入“貌似高效、实则麻木”的僵化中。
(四) AI与论文工厂的“共谋”结构性危机
在Matt Spick等人眼中,如今的论文工厂,已经从传统的“人肉代写”升级为“AI协同产出”的新形态。AI不仅能润色语言、结构文本,还能根据关键词生成研究背景与讨论,结合现成数据,形成表面完备的“论文外壳”。
例如,一段Python脚本可以自动调用NHANES数据库中的变量,通过循环生成上千种“维度组合”,每种组合都可以写成一篇独立论文。再用AI完成初步文案与图表润色,最后提交至付费开放获取期刊,一条“论文流水线”就此完成。
这一过程,正是哲学家汉娜·阿伦特所说的“平庸之恶”的当代理解。论文工厂的参与者可能并非刻意造假者,而只是“在规则下尽力完成KPI”的普通科研人员。但正是这种对机制的默认与机械执行,构成了对科学最大的亵渎。
而这种“共谋”,并不仅限于写作者与AI,还有期刊本身。众多开放获取期刊——尤其是非高影响力期刊——依赖作者付费盈利,往往在投稿量与收入之间形成正向激励。当AI产出的“格式良好论文”源源不断提交时,期刊即使心知有问题,也常常“睁一只眼闭一只眼”。
据Science报道,这类论文每篇大约支付1000美元的版面费,意味着单个数据集可能在一年内为出版商带来数百万美元的收益。面对如此诱惑,所谓“同行评审”常常流于形式。
科学,本该是揭示真理的工具,但在AI和商业动因的双重驱动下,变成了一场“自动生成、自动提交、自动接受”的游戏。而这场游戏的代价,是我们对科研本质的彻底背叛。
(五) AI性论文的破局之道(个人的粗略见解)
Matt Spick和Reese Richardson并非只是批判者,他们也在寻找出路。首先,期刊应对这类“AI拼装论文”设立更高门槛。比如:
明确要求作者解释变量选择、数据处理逻辑;
要求提供全套原始分析代码与版本控制记录;
引入多重假设检验校正机制,如FDR校正或Bonferroni方法。
其次,科研界应正视AI的“辅助性”角色,而非“主导性”角色。AI可以帮助编辑快速筛选格式不当稿件,也可以辅助语义润色,但永远不能替代判断力与逻辑审视。对AI的应用,应建立在“人类控制下的协作”之上。
第三,更根本的问题,是科研评价体系必须变革。中国式“发论文换职称”“灌水论文养KPI”的模式,催生了对AI与数据库滥用的制度性需求。唯有让“研究意义”与“社会影响”成为科研考核的核心,才能让“垃圾论文”失去生存土壤。
教育部和基金委正在推进“破五唯”,这是一种进步。但更重要的是,各高校、医院、研究机构要真正落实评价多元化,让“不发论文但做实事”的学者也能获得认可。
技术从来不是中性的,它既能照亮前路,也能撕开深渊。
公共数据库本是科学民主化的产物,AI本是提高效率的利器,但当这两者在商业与制度扭曲下结盟,便演化为一场科学生态的灾难。我们亲眼目睹:科学的神圣不再由质疑与探索守护,而是由脚本和模型量产;同行评审不再是学术共识构建的舞台,而沦为自动化产物的验收流程。
写论文,不只是把变量和结局组合一下,不是“套模板”就能抵达真理的过程。写作,是思考;思考,是科学最珍贵的能力。
别让AI代替我们思考。
别让“科学”沦为生产指标。
别让这个时代的学术,成为未来历史的笑谈。
2024年度国自然医学部50大科研热点中标数统计如下:
往期精彩文章
如果您属于这种科研现状,国自然辅导请务必绕开我们团队为何如此执着于想知道国自然意见的评分A、B、C?画一个亮眼的技术路线图,需要做到几点?看完这篇你就懂了!国自然杂谈 | 评审意见很不错但就不给中,为啥啊?国自然老司机超干货直播合集!从选题到创新点全拆解2025国自然必读!脂滴-线粒体互作前沿剖析与全流程技术攻略2024国自然爆款解读:入核/出核机制解析与研究套路全攻略2024国自然热点深读:棕榈酰化的机制解析与研究新策略2024国自然热点课题全拆解:线粒体转移机制与套路大公开2024国自然爆款课题解密:血管生成机制研究全攻略!
页:
[1]