Nature：AI科研的双重后果——个体理性奋进集体探索徘徊_凯发app官网登录入口,凯发网娱乐官方网站

产品中心

新闻资讯

电话：400-123-4567
传真：+86-123-4567
邮箱：admin@youweb.com
地址：广东省广州市天河区88号

第三系列

当前位置: 首页 > 产品中心 > 第三系列

Nature：AI科研的双重后果——个体理性奋进集体探索徘徊

浏览次数：584 发布时间：2026-02-10 13:03:37

　　》）和 Nature 的两项研究。它们并非给出相互对立的判断，而是从科研流程的不同环节切入，揭示了同一场变革的两面性：大语言模型一方面拓宽了科学家的阅读与连接范围，另一方面却可能收紧科学发现的实际路径。合在一起，这些发现共同勾勒出一个耐人寻味的图景——科学家读得更广，却做得更窄。

　　AI 已深度融入知识生产过程，如 AlphaFold 预测蛋白质结构等突破性成果展示了其巨大潜力。然而，AI 工具对科学家和科学整体特征的影响尚不完全清楚。尽管现有研究表明 AI 为科学家带来了个人利益，但也引发了对科学领域马太效应和引用模式变化的担忧。

　　该研究基于 OpenAlex 数据库中 1980 年至 2025 年间的 4130 万篇自然科学论文（涵盖生物学、化学、物理学等六大基础学科），利用微调的 BERT 模型识别 AI 辅助的研究，旨在回答以下问题：

　　图 1：AI 扩大了论文影响力并促进了研究人员的职业生涯。a, AI 论文（红色）与非 AI 论文（蓝色）发表后的平均年引用次数（插图显示了前 1% 和前 10% 的情况；样本量 n = 27,405,011），结果显示 AI 论文吸引了更多引用。b, 使用 AI 的研究人员与未使用 AI 的同行（对照组）的平均年引用次数（P 0.001，样本量 n = 5,377,346），其中采用 AI 的研究人员获得的引用次数是未采用者的 4.84 倍。c, 采用 AI 的初级科学家与未采用 AI 的同行之间两种角色转变的概率（每个领域 n = 46 年的观测值）。与未采用 AI 的同行相比，采用 AI 的初级科学家成为知名研究者（established researchers，即项目负责人）的概率更高，而退出学术界的概率更低。d, 从初级科学家向既定研究者转变的生存函数（P 0.001，样本量 n = 2,282,029）。生存函数可以很好地用指数分布拟合，结果表明采用 AI 的初级科学家更早成为既定研究者。对于所有面板，99% 置信区间（CIs）均以误差条形式显示，其中图 a 的插图以 1% 和 10% 分位数为中心，其他子图以均值为中心。所有统计检验均使用双侧 t 检验

　　从事 AI 增强研究的科学家，其发表论文数量是未使用 AI 同行的 3.02 倍，获得的引用次数更是高达 4.84 倍。这种优势在控制了早期职业地位后依然存在，表明 AI 本身就是造成差异的重要因素。

　　AI 的使用加速了初级科学家向既定研究者（项目负责人）的转变。采用 AI 的初级科学家成为项目负责人的时间比同行平均缩短了 1.37 年，且不仅增加了晋升概率（高出 13.64%），还降低了退出学术界的风险。

　　需要注意的是 AI 辅助的研究团队规模通常更小，平均减少了 1.33 名成员，且主要减少的是初级科学家。这暗示 AI 可能正在替代部分初级研究人员的数据处理和模式识别工作。

　　研究引入了知识广度（Knowledge Extent）这一指标，即论文集合在向量空间覆盖的直径。结果显示，与传统研究相比，AI 驱动的研究在所有学科中都导致了集体知识广度的收缩，中位数下降了 4.63%。

　　AI 研究的知识分布熵值更低，表明研究焦点日益不成比例地集中在特定领域的现有热门问题上，而非探索新的领域。

　　图 3：AI 的采用与科学领域内外知识程度的收缩有关。a，研究团队使用预训练的文本嵌入模型将研究论文嵌入 768 维向量空间 ; 然后测量该空间内论文的知识程度。b，为了可视化，研究团队使用 t 分布随机邻域嵌入 ( t-SNE ) 算法将随机批次 10,000 篇论文 ( 其中一半是 AI 论文 ) 的高维嵌入平铺到二维图中。如实心箭头和圆形边界所示，在整个自然科学领域，AI 论文的知识程度 ( 在未平铺的空间中计算 ) 较小。此外，AI 论文在知识空间中更加集中，表明对特定问题的关注更加集中。c，每个领域中 AI 和非 AI 论文的知识程度 ( P0.001，每个领域中 n = 1,000 个样本 ) ，其中 AI 研究侧重于更加收缩的知识空间。d，每个领域人工智能和非人工智能论文的知识熵 ( P0.001，每个领域 n = 1,000 个样本 ) ，其中人工智能研究的熵较低。对于面板 c 和 d，方框图以中位数为中心，以第一和第三四分位数 ( Q1 和 Q3 ) 为界。所有统计检验都使用中位数检验。

　　如图 3 所示，在嵌入向量空间的可视化中，AI 论文（红色点）相比非 AI 论文（蓝色点）在知识空间上的分布更为聚集，覆盖范围更小。这意味着 AI 正引导科学界在已知的数据丰富区域深耕，而非向未知的边缘拓展。

　　研究分析了引用同一篇 AI 论文的后续论文之间的关系，发现它们彼此引用的频率比非 AI 领域低了22%。这表明 AI 研究往往形成围绕特定热门成果的星状结构，而非相互交织的网络结构。AI 论文引发的后续研究更像是孤独的群体，彼此缺乏对话。

　　图 4：AI 与非 AI 论文的引用分布情况。AI 论文往往更多地集中在少数顶尖论文上（P 0.001，n = 100 个采样论文组），表现出更强的马太效应。

　　AI 领域的引用分布极不均衡。前22.20%的顶尖论文占据了80%的引用量，其基尼系数（0.754）显著高于非 AI 论文（0.690）。这种符合二八定律的局面进一步强化了对少数热门主题的关注。

　　分析显示，数据可用性是 AI 选题的主要驱动因素。AI 倾向于涌向那些数据最丰富的领域，从而导致知识空间的集中，而那些缺乏数据的基础性或新兴问题则可能被边缘化。

　　这项研究揭示了一个加速后的两难。AI 既是科学家个人成功的加速器，也可能是科学集体探索的减速带。

　　科学家为了追求更高的产出和影响力，有强烈的动力采用 AI。然而，这种微观上的理性选择，在宏观上却导致了科学界扎堆解决已知问题，甚至是在重复性地优化现有方案，而非开辟新天地。

　　这一发现对科学政策提出了挑战。仅仅增加对 AI 科研的资助可能会加剧富数据领域的拥挤，而忽视那些数据稀缺但至关重要的基础问题。

　　为了保持科学探索的多样性，至少未来的 AI 系统不应仅局限于认知能力的增强（如数据分析），更需要扩展感知和实验能力（Sensory and experimental capacity）。我们需要能帮助科学家收集新数据、探索未知领域的 AI，而不仅仅是处理现有数据的 AI。

　　识别方法的局限：使用的 BERT 模型虽然经过专家验证，但可能遗漏了一些微妙或未在摘要中明确提及的 AI 使用情况

　　样本范围：研究聚焦于自然科学，排除了计算机科学和数学（AI 方法的诞生地），也未包含社会科学等领域，这可能限制了结论的普适性。

　　因果关系的复杂性：尽管使用了对照分析，但难以完全确定 AI 采用与科学影响之间的严格因果链条，且目前主要反映的是基于数据处理和模式识别的 AI 应用（如机器学习、深度学习），对新式 AI 的长期影响分析显然处于初步阶段

　　AI 正在以前所未有的速度重塑科学界。它让科学家跑得更快，但也可能让我们跑在同一条拥挤的跑道上。如何在利用 AI 提升效率的同时保持科学探索的广度与好奇心，是该团队认为的未来科学发展的关键命题。

　　结合集智俱乐部昨日解读 Science 论文 ( Kusumegi et al., 2025，详情请见《Science：大语言模型如何重塑科学产出》 ) ，我们会发现我们似乎面临一个悖论：

　　• Science：LLM 让科学家引用了更多跨学科、跨文化、更老或更新的文献，似乎拓宽了视野。

　　• nature：AI 工具（主要是 ML/DL）导致科学探索的视野收缩。

　　这并非立场的冲突，而是通过不同的切面拼凑出了完整的科研图景——现在我们读得更广，做得更窄。

　　LLM 作为辅助工具，确实帮助我们跨越了语言和阅读障碍，让我们能看到 ——至于人是否真的看了我们无从得知——更多的东西。但是，当涉及到核心的科学发现环节时，算法的本质鼓励了我们只能去那些有数据富集的领域，导致我们的原型（archetype）选择变得拥挤和趋同。

　　对于黑箱以外的观察是信息摄入（Input）变宽了，但我们的知识生产（Output）变窄了。所以现在的局面就变成了一种很微妙的反向约束。AI 在阅读端帮我们打破了壁垒；但在生产端，其数据饥渴的属性又把我们按回了那些最拥挤的熟地里。这里有一个案例：MOSAIC（Multiple Optimized Specialists for AI-assisted Chemical Prediction）基于 Llama-3.1-8B-instruct 架构构建，通过在 Voronoi 聚类空间中训练 2498 个专业化学专家模型，为复杂合成提供具有置信度指标的可复现、可执行的实验方案。 ( Li et al., 2026, p. 1 ) 然而，MOSAIC 的运作机制也恰恰印证了 Nature 论文所指出的隐忧。MOSAIC 之所以强大，是因为有数百万反应方案的既有数据供其挖掘。这种基于海量历史数据训练出来的专家混合模型，本质上是在自动化既有领域（automate established fields）（Hao et al., 2026），在已知的数据空间里进行极致的优化和预测。

　　与其说是 AI 限制了我们，不如说是我们为了追求发表效率，主动选择了去摘那些 AI 够得着的低垂果实，即使是以一种极其繁复的手段。结果就是大家方法越来越花哨，做出来的东西却越来越像。未来的挑战之一可能不在于怎么用 AI 分析数据，而在于怎么用 AI 去那些没有数据的地方感知出新数据来。

　　AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science，机器学习和其他 AI 技术可以用来解决科学研究中的问题，从预测天气和蛋白质结构，到模拟星系碰撞、设计优化核聚变反应堆，甚至像科学家一样进行科学发现，被称为科学发现的第五范式。另一方面是 Science for AI，科学尤其是物理学中的规律和思想启发机器学习理论，为人工智能的发展提供全新的视角和方法。

　　集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖（Jure Leskovec 教授指导）、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣（Max Tegmark 教授指导），共同发起以AI+Science为主题的读书会，探讨该领域的重要问题，共学共研相关文献。读书会已完结，现在报名可加入社群并解锁回放视频权限。

　　3.AI 能否成为社会科学家？GPT-4 模拟人类行为实验效应的突破与隐忧

上一篇: 2025年摩托车和汽车使用年限及报废注销指南

下一篇: 兴全新视野定开混合

【返回列表页】

Nature：AI科研的双重后果——个体理性奋进集体探索徘徊

浏览次数：584 发布时间：2026-02-10 13:03:37

友情链接