凯发app官网登录入口,凯发网娱乐官方网站


产品中心

新闻资讯

更多
电话:400-123-4567
传真:+86-123-4567
邮箱:admin@youweb.com
地址:广东省广州市天河区88号

第三系列

当前位置: 首页 > 产品中心 > 第三系列

Nature:AI科研的双重后果——个体理性奋进集体探索徘徊

浏览次数:584 发布时间:2026-02-10 13:03:37

  》)和 Nature 的两项研究。它们并非给出相互对立的判断,而是从科研流程的不同环节切入,揭示了同一场变革的两面性:大语言模型一方面拓宽了科学家的阅读与连接范围,另一方面却可能收紧科学发现的实际路径。合在一起,这些发现共同勾勒出一个耐人寻味的图景——科学家读得更广,却做得更窄。

  AI 已深度融入知识生产过程,如 AlphaFold 预测蛋白质结构等突破性成果展示了其巨大潜力。然而,AI 工具对科学家和科学整体特征的影响尚不完全清楚。尽管现有研究表明 AI 为科学家带来了个人利益,但也引发了对科学领域马太效应和引用模式变化的担忧。

  该研究基于 OpenAlex 数据库中 1980 年至 2025 年间的 4130 万篇 自然科学论文(涵盖生物学、化学、物理学等六大基础学科),利用微调的 BERT 模型识别 AI 辅助的研究,旨在回答以下问题:

  图 1:AI 扩大了论文影响力并促进了研究人员的职业生涯。a, AI 论文(红色)与非 AI 论文(蓝色)发表后的平均年引用次数(插图显示了前 1% 和前 10% 的情况;样本量 n = 27,405,011),结果显示 AI 论文吸引了更多引用。b, 使用 AI 的研究人员与未使用 AI 的同行(对照组)的平均年引用次数(P 0.001,样本量 n = 5,377,346),其中采用 AI 的研究人员获得的引用次数是未采用者的 4.84 倍。c, 采用 AI 的初级科学家与未采用 AI 的同行之间两种角色转变的概率(每个领域 n = 46 年的观测值)。与未采用 AI 的同行相比,采用 AI 的初级科学家成为知名研究者(established researchers,即项目负责人)的概率更高,而退出学术界的概率更低。d, 从初级科学家向既定研究者转变的生存函数(P 0.001,样本量 n = 2,282,029)。生存函数可以很好地用指数分布拟合,结果表明采用 AI 的初级科学家更早成为既定研究者。对于所有面板,99% 置信区间(CIs)均以误差条形式显示,其中图 a 的插图以 1% 和 10% 分位数为中心,其他子图以均值为中心。所有统计检验均使用双侧 t 检验

  从事 AI 增强研究的科学家,其发表论文数量是未使用 AI 同行的 3.02 倍,获得的引用次数更是高达 4.84 倍。这种优势在控制了早期职业地位后依然存在,表明 AI 本身就是造成差异的重要因素。

  AI 的使用加速了初级科学家向既定研究者(项目负责人)的转变。采用 AI 的初级科学家成为项目负责人的时间比同行平均缩短了 1.37 年,且不仅增加了晋升概率(高出 13.64%),还降低了退出学术界的风险。

  需要注意的是 AI 辅助的研究团队规模通常更小,平均减少了 1.33 名成员,且主要减少的是初级科学家。这暗示 AI 可能正在替代部分初级研究人员的数据处理和模式识别工作。

  研究引入了 知识广度 (Knowledge Extent)这一指标,即论文集合在向量空间覆盖的 直径 。结果显示,与传统研究相比,AI 驱动的研究在所有学科中都导致了集体知识广度的收缩,中位数下降了 4.63%。

  AI 研究的知识分布熵值更低,表明研究焦点日益不成比例地集中在特定领域的现有热门问题上,而非探索新的领域。

  图 3:AI 的采用与科学领域内外知识程度的收缩有关。a,研究团队使用预训练的文本嵌入模型将研究论文嵌入 768 维向量空间 ; 然后测量该空间内论文的知识程度。b,为了可视化,研究团队使用 t 分布随机邻域嵌入 ( t-SNE ) 算法将随机批次 10,000 篇论文 ( 其中一半是 AI 论文 ) 的高维嵌入平铺到二维图中。如实心箭头和圆形边界所示,在整个自然科学领域,AI 论文的知识程度 ( 在未平铺的空间中计算 ) 较小。此外,AI 论文在知识空间中更加集中,表明对特定问题的关注更加集中。c,每个领域中 AI 和非 AI 论文的知识程度 ( P0.001,每个领域中 n = 1,000 个样本 ) ,其中 AI 研究侧重于更加收缩的知识空间。d,每个领域人工智能和非人工智能论文的知识熵 ( P0.001,每个领域 n = 1,000 个样本 ) ,其中人工智能研究的熵较低。对于面板 c 和 d,方框图以中位数为中心,以第一和第三四分位数 ( Q1 和 Q3 ) 为界。所有统计检验都使用中位数检验。

  如图 3 所示,在嵌入向量空间的可视化中,AI 论文(红色点)相比非 AI 论文(蓝色点)在知识空间上的分布更为聚集,覆盖范围更小。这意味着 AI 正引导科学界在 已知 的数据丰富区域深耕,而非向 未知 的边缘拓展。

  研究分析了引用同一篇 AI 论文的后续论文之间的关系,发现它们彼此引用的频率比非 AI 领域低了22%。这表明 AI 研究往往形成围绕特定热门成果的 星状结构 ,而非相互交织的 网络结构 。AI 论文引发的后续研究更像是 孤独的群体 ,彼此缺乏对话。

  图 4:AI 与非 AI 论文的引用分布情况。AI 论文往往更多地集中在少数顶尖论文上(P 0.001,n = 100 个采样论文组),表现出更强的马太效应。

  AI 领域的引用分布极不均衡。前22.20%的顶尖论文占据了80%的引用量,其基尼系数(0.754)显著高于非 AI 论文(0.690)。这种符合 二八定律 的局面进一步强化了对少数热门主题的关注。

  分析显示,数据可用性是 AI 选题的主要驱动因素。AI 倾向于涌向那些数据最丰富的领域,从而导致知识空间的集中,而那些缺乏数据的基础性或新兴问题则可能被边缘化。

  这项研究揭示了一个加速后的两难。AI 既是科学家个人成功的加速器,也可能是科学集体探索的减速带。

  科学家为了追求更高的产出和影响力,有强烈的动力采用 AI。然而,这种微观上的理性选择,在宏观上却导致了科学界扎堆解决已知问题,甚至是在重复性地优化现有方案,而非开辟新天地。

  这一发现对科学政策提出了挑战。仅仅增加对 AI 科研的资助可能会加剧 富数据 领域的拥挤,而忽视那些数据稀缺但至关重要的基础问题。

  为了保持科学探索的多样性,至少未来的 AI 系统不应仅局限于认知能力的增强(如数据分析),更需要扩展 感知和实验 能力(Sensory and experimental capacity)。我们需要能帮助科学家收集新数据、探索未知领域的 AI,而不仅仅是处理现有数据的 AI。

  识别方法的局限:使用的 BERT 模型虽然经过专家验证,但可能遗漏了一些微妙或未在摘要中明确提及的 AI 使用情况

  样本范围:研究聚焦于自然科学,排除了计算机科学和数学(AI 方法的诞生地),也未包含社会科学等领域,这可能限制了结论的普适性。

  因果关系的复杂性:尽管使用了对照分析,但难以完全确定 AI 采用与科学影响之间的严格因果链条,且目前主要反映的是基于数据处理和模式识别的 AI 应用(如机器学习、深度学习),对新式 AI 的长期影响分析显然处于初步阶段

  AI 正在以前所未有的速度重塑科学界。它让科学家跑得更快,但也可能让我们跑在同一条拥挤的跑道上。如何在利用 AI 提升效率的同时保持科学探索的广度与好奇心,是该团队认为的未来科学发展的关键命题。

  结合集智俱乐部昨日解读 Science 论文   ( Kusumegi et al., 2025,详情请见《Science:大语言模型如何重塑科学产出》 ) ,我们会发现我们似乎面临一个悖论:

  •   Science:LLM 让科学家引用了更多跨学科、跨文化、更老或更新的文献,似乎拓宽了视野。

  •   nature:AI 工具(主要是 ML/DL)导致科学探索的视野收缩。

  这并非立场的冲突,而是通过不同的切面拼凑出了完整的科研图景——现在我们读得更广,做得更窄。

  LLM 作为辅助工具,确实帮助我们跨越了语言和阅读障碍,让我们能 看到 ——至于人是否真的看了我们无从得知——更多的东西。但是,当涉及到核心的科学发现环节时,算法的本质鼓励了我们只能去那些有数据富集的领域,导致我们的原型(archetype)选择变得拥挤和趋同。

  对于黑箱以外的观察是信息摄入(Input)变宽了,但我们的知识生产(Output)变窄了。所以现在的局面就变成了一种很微妙的反向约束。AI 在阅读端帮我们打破了壁垒;但在生产端,其 数据饥渴 的属性又把我们按回了那些最拥挤的熟地里。这里有一个案例:MOSAIC(Multiple Optimized Specialists for AI-assisted Chemical Prediction)基于 Llama-3.1-8B-instruct 架构构建,通过在 Voronoi 聚类空间中训练 2498 个专业化学专家模型,为复杂合成提供具有置信度指标的可复现、可执行的实验方案。 ( Li et al., 2026, p. 1 )   然而,MOSAIC 的运作机制也恰恰印证了 Nature 论文所指出的隐忧。MOSAIC 之所以强大,是因为有数百万反应方案的既有数据供其挖掘。这种基于海量历史数据训练出来的专家混合模型,本质上是在 自动化既有领域(automate established fields)(Hao et al., 2026),在已知的数据空间里进行极致的优化和预测。

  与其说是 AI 限制了我们,不如说是我们为了追求发表效率,主动选择了去摘那些 AI 够得着的低垂果实,即使是以一种极其繁复的手段。结果就是大家方法越来越花哨,做出来的东西却越来越像。未来的挑战之一可能不在于怎么用 AI 分析数据,而在于怎么用 AI 去那些没有数据的地方 感知 出新数据来。

  AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的 第五范式 。另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。

  集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以AI+Science为主题的读书会,探讨该领域的重要问题,共学共研相关文献。读书会已完结,现在报名可加入社群并解锁回放视频权限。

  3.AI 能否成为 社会科学家 ?GPT-4 模拟人类行为实验效应的突破与隐忧