米兰·(milan)中国官方网站-Nature 正刊收录!清华 FIB 实验室揭示:AI 提升科学家个人影响力,却收缩科学整体探索空间
Nature 正刊收录!清华 FIB 试验室展现:AI 晋升科学家小我私家影响力,却紧缩科学总体摸索空间
于今世科学研究中,人工智能正于转变的不只是研究效率,而是科研勾当自己的布局。
跟着 AI 东西于天然科学中的广泛运用,愈来愈多的研究可以于更短期内完成,论文产出及援用回报也随之提高。于以发表数目、影响力及速率为焦点指标的学术系统中,这类效率上风正于直接影响研究者的举动选择及研究标的目的结构。
然而,效率的晋升其实不一定象征着科学摸索的拓展。当 AI 更擅优点理数据足够、问题明确、路径成熟的研究使命时,科研勾当是否会总体性地向这些标的目的集中,从而转变科学常识的漫衍布局及演化方式,这是一个持久存于但缺少体系证据的问题。个别层面的乐成是否真的可以或许累积为团体层面的前进,于 AI 深度参与科研以后,反而变患上越发值患上从头审阅。
于这一问题配景下,清华年夜学 FIB 试验室牵头开展了一项年夜范围实证研究,论文题为《Artificial Intelligence Tools Expand Scientists’ Impact but Contract Science’s Focus》并已经被 Nature 正刊收录。
研究基在笼罩 1980–2025 年、跨越四万万篇天然科学论文及五百多万名研究职员的持久数据,从小我私家科研回报与科学总体布局两个层面,体系阐发了人工智能东西于天然科学中的扩散历程和其深层影响。
研究提出的焦点发明具备明确的张力:人工智能显著放年夜了个别科学家的学术影响力,但与此同时,科学总体的研究规模及互动布局却可能正于紧缩。

论文地址:https://www.nature.com/articles/s41586-025-09922-y
对于在当下火热的 AI for Science (AI4S) 范畴,这篇文章不仅是近况的描写,更是一份深刻的提示:真实的科学冲破往往发生于“数据贫瘠”或者“非共鸣”的荒漠。假如 AI4S 仅仅沦为“于已经有年夜数据的范畴刷榜”的东西,它将致使科学摸索的内卷化。
AI 带来的并不是只有增加,还有有重构这篇论文的试验成果经由过程一系列量化阐发,体系地展现了人工智能于天然科学研究中的真实影响。
研究起首证实,人工智能于天然科学中的采用已经经成为一种范围巨年夜且不停加快的趋向。作者于 1980–2025 年的天然科学论文中共鸣别出 310,957 篇 AI-augmented papers,占全数样本的约 0.75%,而研究笼罩的总范围到达 41,298,433 篇论文及 5,377,346 名研究者。
进一步的时间序列阐发显示,于传统呆板进修、深度进修及天生式 AI 三个阶段中,论文及研究者采用 AI 的速率均连续加速。详细来看,1980 到 2025 年间,AI 论文占比于差别学科中上升了数十倍,例如地质学上升 10.70 倍,生物学上升 51.89 倍。
与此同时,采用 AI 的研究者占比增加患上更快,于地质学中到达 135.46 倍,于物理学中高达 362.16 倍。这些成果起首注解,AI 于天然科学中的扩散是一种体系性变化,而非个体范畴的偶发明象。

于个别科学家层面,试验成果显示 AI 的采用与科研回报之间存于显著联系关系。论文给出的焦点结论是,利用 AI 的科学家,其论文发表数目平均是未利用者的 3.02 倍,得到的援用数目平均是未利用者的 4.84 倍,而且于职业成长上更早成为研究卖力人,时间平均提早约 1.37 年。
这些结论基在年夜范围样天职析患上出。于包罗 5,377,346 名研究者的数据中,六个天然科学学科里采用 AI 的研究者,其年均发表量均显著高在未采用者,且统计查验成果到达 P 0.001。同时,于 27,405,011 篇援用记载完备的论文样本中,AI 论文于发表后的多年里,其年均援用数比非 AI 论文超出跨越 98.70%。这些数据配合申明,AI 于个别层面显著放年夜了科学家的科研产出及学术影响力。

然而,当研究视角从小我私家扩大到总体科学生态时,试验成果出现出相反的趋向。研究职员经由过程将论文嵌入到 768 维的科学语义空间中,并丈量论文调集笼罩规模,发明 AI 研究于总体上的常识广度较着小在非 AI 研究,于六个学科中位数平均紧缩 4.63%,且于细分到 200 多个子范畴后,这类紧缩仍旧于 70% 以上的子范畴中存于。

同时,AI 研究的常识漫衍越发集中,研究留意力更易聚焦于少数焦点问题上。于学术互动方面,援用统一篇论文的后续研究之间,相互互动的水平平均削减 22%,注解 AI 研究更易缭绕少数焦点结果睁开,而不是形成彼此毗连的新研究收集。
援用漫衍阐发进一步显示,AI 研究中前 22.20% 的论文得到了 80% 的援用,前 54.14% 的论文得到了 95% 的援用,其援用不服等水平以 Gini 系数目化后为 0.754,较着高在非 AI 研究的 0.690。综合这些成果,论文用数据清晰地注解,AI 于显著晋升个别科研回报的同时,也使科学研究于总体层面变患上越发集中,学术互动削减,摸索空间随之紧缩。

这项研究的试验设计可以理解为一条从辨认、比照到布局丈量的完备阐发流程。
研究团队起首以 OpenAlex 数据库中的天然科学论文及研究职员收集作为整体样本,主阐发范围为 41,298,433 篇论文及 5,377,346 名研究职员,时间跨度笼罩 1980–2025 年,并根据呆板进修、深度进修及天生式 AI 三个阶段举行划分。
研究团队决心将阐发重点放于天然科学中把 AI 作为研究东西的结果,而不是计较机科学或者数学中开发 AI 要领自己的研究,从而确保研究对于象是 AI 对于科学出产方式的外溢影响,而非 AI 学科内部的技能演化。
于区别 AI 与非 AI 研究时,研究团队没有采用要害词匹配的要领,而是对于预练习的 BERT 语言模子举行两阶段微调,别离于论文标题及择要上练习模子,并将二者集成为同一的辨认器,以削减报酬选择触发词所带来的误差。
为验证这类辨认方式的靠得住性,研究职员构造具有相干配景的专家对于随机抽样论文举行盲审标注,成果显示专家之间的一致性 Fleiss’ κ 到达 0.964,而模子于以专家标注为真值的评估中 F1 值到达 0.875。这一步为后续所有阐发提供了要害条件,即 AI 与非 AI 研究结果的划分具备充足的正确性及不变性。

于小我私家层面的阐发中,研究团队重要利用研究职员的年度论文发表数目及年度援用数目来权衡科研产出与学术影响力,并联合职业阶段变化来描画研究职员从 junior 阶段改变为 established 或者 leader 的历程。基在这些指标,研究职员患上出了利用 AI 的科学家发文数目增长 3.02 倍、援用数目增长 4.84 倍,而且更早成为研究卖力人的结论,这些成果于差别学科中体现出一致的显著性。

于团体层面的阐发中,研究团队经由过程两类指标来量化科学布局的变化。第一类是常识广度,研究职员利用 SPECTER 2.0 将研究结果映照到 768 维语义空间中,并将一组抽样结果于该空间中所笼罩的最年夜间隔界说为常识广度,用以比力 AI 与非 AI 研究于主题笼罩规模上的差异。

第二类是后续互动,研究职员将援用统一项原始研究的后续结果视为一个总体,统计这些结果之间的彼此援用密度,成果发明 AI 研究的后续互动削减约 22%。研究团队据此指出,AI 研究更易缭绕少数热点焦点结果形成放射式布局,而不是像新兴研究范畴那样形成彼此毗连、不停扩大的研究收集。
被效率机制挤出的摸索空间
这项研究的意义不于在简朴地患上出人工智能好或者欠好的结论,而于在研究团队用体系的数据指出了一个更深层的问题:人工智能于较着晋升小我私家科研收益的同时,可能正于转变科学总体进步的方式,并且这类转变未必是抱负的。
研究职员发明,利用 AI 的科学家于小我私家层面得到了很是明确的利益,包括论文发表数目增长 3.02 倍、援用数目增长 4.84 倍,以和平均提早 1.37 年景为研究卖力人。但与此同时,于总体层面,科学研究笼罩的常识规模却紧缩了 4.63%,研究之间的互动也削减了 22%。这些数据配合注解,小我私家影响力的扩展,正于陪同着团体摸索规模的缩小。
进一步来看,研究团队其实不认为这类征象是由于研究职员变患上不努力或者缺少创造力,而是指出了一种更实际的机制。当人工智能更易于数据足够的研究标的目的上带来更高效率及更好体现时,研究职员于理性选择下,天然会把更多时间及资源投入这些标的目的。雷峰网
成果是,科学研究不停于数据富厚的范畴中被加快、优化及反复,而那些数据稀缺、但可能更基础、更具创始性的研究问题,则更易被边沿化。研究职员还有发明,一些直觉上可能主要的因素,例如研究主题自己是否热点、初期影响力巨细或者是否得到优先资助,与这类集中趋向的瓜葛其实不较着,比拟之下,数据是否轻易得到更多是鞭策 AI 集中利用的要害缘故原由。
基在这些发明,研究团队对于科研政策及 AI for Science 的成长标的目的提出了提示。假如学术评价系统及资源分配机制继承重要奖励更快产出及更高援用,那末人工智能带来的小我私家激励会被进一步放年夜,而科学总体层面的研究集中、互动削减及摸索规模变窄,也可能随之加重。
换句话说,人工智能可能会让科学研究变患上愈来愈高效,但同时也可能让科学摸索变患上愈来愈守旧,这恰是研究团队但愿经由过程这项研究引起存眷的焦点问题。雷峰网(公家号:雷峰网)
项目暗地里的科研气力这篇论文的一作是郝千越,他今朝是清华年夜学电子工程系的博士研究生,研究标的目的重要集中于人工智能范畴,包括强化进修及年夜语言模子等标的目的。
本科阶段,郝千越一样就读在清华年夜学电子工程系,于博士阶段连续从事人工智能要领和其运用相干的研究事情。于科研结果方面,他于 NeurIPS、KDD 等国际顶级人工智能集会及期刊上发表过量篇论文,此中多项事情得到 Spotlight 等承认。

参考资料:https://haohaoqian.github.io/
这篇论文的通信作者之一是徐丰力。徐丰力现任清华年夜学电子工程系助理传授、博士生导师,在 2023 年入职清华年夜学,于该系开展人工智能、数据科学、社管帐算与繁杂收集等标的目的的研究事情。他初期于清华年夜学得到工学博士学位,随后曾经于中国香港科技年夜学及芝加哥年夜学从事博士后研究。
于研究标的目的上,徐丰力传授重要存眷基在数据驱动及人工智能的要领来建模繁杂信息体系及人类举动模式,特别聚焦年夜语言模子、社会举动计较、都会科学等交织范畴。
今朝,他已经于 Nature Co妹妹unications、Nature Human Behaviour、PNAS 等顶级综合性学术期刊,以和 NeurIPS、KDD、WWW 等国际集会上发表多篇高程度论文,并得到吴文俊人工智能优异青年奖、CAAI 社管帐算新星学者奖、微软学者奖研金等多项学术声誉。
参考资料:https://fenglixu.github.io/
这篇论文的别的两位通信作者别离是清华年夜学的李勇传授及芝加哥年夜学的 James Evans 传授。
此中,李勇是清华年夜学电子工程系的长聘传授、博士生导师,并担当都会科学与计较研究中央卖力人,是教诲部长江学者。他持久从事人工智能、数据科学、繁杂体系与社管帐算等交织学科研究,主持了多个国度重点研发规划及国度天然科学基金重点项目。
于科研结果方面,李勇传授于人工智能及数据科学标的目的堆集了富厚研究结果,于 Nature Computational Science、Nature Machine Intelligence、Nature Human Behaviour、Nature Cities 等综合性期刊,以和 ACM KDD、NeurIPS、ICLR、WWW 等国际集会上发表了年夜量高程度论文,累计援用跨越三万屡次,并拥有多项授权专利。
他曾经入选全世界高被引科学家、国度万人规划青年拔尖人材,得到教诲部科技前进一等奖、IEEE ComSoc 亚太卓异青年学者奖、吴文俊人工智能优异青年奖等多项声誉,同时也担当多个国际集会筹委会成员及国际期刊编委。

参考资料:https://fi.ee.tsinghua.edu.cn/~liyong/
James Evans 是芝加哥年夜学社会学系的 Max Palevsky 传授,同时担当该校 Knowledge Lab 的主任及计较社会科学项目的学术卖力人,并于 Santa Fe Institute 等机构任客座或者外部传授。他的研究重点是理解常识与团体思维体系的形成与演化机制,包括留意力漫衍、思惟发源、同享思维模式、协同与争议历程,以和确定性与不确定性怎样于群体中堆集。
于研究要领上,James Evans 常利用年夜范围数据、呆板进修及天生模子等东西来切磋人类理解与立异的团体机制。他的研究结果发表于 Nature、Science、PNAS 等顶级学术期刊,并常常遭到 The New York Times、The Economist、BBC、CNN 等国际媒体的存眷与报导。此外,James Evans 还有持久于学术界从事编纂、评论及项目引导等事情。

James Evans 参考资料:https://sociology.uchicago.edu/directory/james-evans
值患上一提的是,研究团队并未止步在对于问题的辨认及诊断,而是测验考试于实践层面回应这一布局性挑战。缭绕人工智能于科研中可能加重研究集中、压缩摸索空间的危害,徐丰力、李勇传授团队进一步提出了一种面向将来科研范式的解决思绪,推出了一个夸大全流程协同与跨学科摸索的科研智能系统统 OmniScientist(拜候网址:OmniScientist.ai)。

拜候地址:OmniScientist.ai
与将 AI 仅作为单点东西嵌入科研流程差别,OmniScientist 试图将人工智能引入科研问题界说、文献理解、假定天生、要领设计及成果阐发等多个要害环节,经由过程多智能体协作的方式,帮忙研究者体系性地拓展研究视角,降低跨范畴摸索的门坎,从而减缓单一数据密集标的目的对于科研路径的过分吸引。
某种意义上,OmniScientist 恰是对于论文所展现问题的直接回应,即于认可 AI 显著晋升科研效率的同时,测验考试经由过程更具布局意识的设计,指导人工智能办事在更广泛、更具摸索性的科学研究方针。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





