米兰·(milan)中国官方网站-对话李国杰:突破麦肯锡和图灵的框框,人工智能要解决大问题丨GAIR 2021

编纂 | 岑峰、青暮
承载东莞冲破固有成长路径而生的松山湖,是我国都会经济高质量转型的一个活泼缩影。
于东莞启动的“科技东莞”规划中,李国杰是最早介入互助的开拓者。假如细数中国IT界的贸易年夜咖,他的名字好像不为人知。但你必然听闻过我国本土高技能品牌:“曙光”及“龙芯”。而李国杰恰是它们暗地里的结构者及创作发明人。鸿儒硕学的李国杰好像与人们津津乐道的贸易传奇形象截然不同,他更像一名深耕学术的年夜师长教师,试图于科研、技能及财产之间,搭起一座畅通领悟领悟的桥梁。
今朝,李国杰兼任中科院云计较中央的首席科学家,年夜部门时间住于东莞松山湖。
2021年,松山湖吹响了“鼎新、立异、再出发”的军号,而“立异”也偏偏是李国杰最注重的一点。
1终日乾乾,与时同行
2021 GAIR年夜会现场
李国杰以前撰文道,立异的要害不单单是成立世界一流年夜学,企业的眼界、实力及科技立异活气也很主要。
他也曾经对于海内AI研究的立异能力暗示了担心。“虽然国度高度器重人工智能技能成长,最近几年来我国粹者也发表了年夜量的 AI 论文及专利等,于聪明都会设置装备摆设、抗击新冠疫情、筹办北京冬奥会等运用中取患上显著成效,呈现了一些人工智能独角兽企业的AI落地结果。但咱们的研究大都是技能驱动、论文导向,方针导向及问题导向的研究较少。”
早于2006年,李国杰就于《中国科学院院刊》中指出:“只管我国企业、年夜学、科研机构的立异能力都很弱,但我认为我国国度立异系统中最单薄的环节是技能转移。”这也恰是他本身做曙光计较机及龙芯CPU财产化的深刻领会,于担当中科院计较所所持久间,他也将“技能转移”作为晋升科研机构立异能力的要害,并鞭策了计较以是“立异超过、连续成长”为导向的科学院常识立异工程的实行。
2011年李国杰离任中科院计较所所长后,位在鼎新开放前沿的中科院云计较中央(前身是广东电子工业研究院)则成了他的另外一个基地—— 2005年李国杰就于东莞松山湖开办广东电子工业研究院,这是东莞市首个与国度级科研机构合办的省级科研平台。

广东电子工业研究院
“成立广东电子工业研究院的目的有两个,一是促成成立一批大众技能办事平台,对于亟需转型的东莞加工制造业提供技能撑持;二是把该研究院打造为中国科学院技能转化的平台。”从李国杰谈和落地东莞成长的缘故原由中不丢脸出,他恰是将广东电子工业研究院作为承载本身立异与技能转移思索与解决方案的一块“实验田”。
李国杰说的“一批”指的是,就于广东电子工业研究院落地东莞以后的第二年,“科技东莞”工程正式启动,东莞开启了结合高校院所、检测技能机构的互助共建之路。一多量大众科技立异平台接踵落户东莞及松山湖,科技立异的资源加快集聚。
为褒奖李国杰多年来对于东莞科技进级及立异的孝敬,2021年,东莞市当局授予李国杰“声誉市平易近”称呼。
受疫情影响,去年李国杰于东莞栖身的时间要更长,也使他患上以静下心来,有更多时间去思索科学研究、立异及科技结果转化之间的瓜葛。
而真正让李国杰上述设法“出圈”的,是2021年八月,一篇名为《李国杰院士:海内AI研究顶不了天、落不了地,该想一想了》的文章。它如平地惊雷,激发激烈热议。也将一贯低调的李国杰推向风口浪尖,攻讦声与撑持声接连不断。
媒体及社交平台上关在海内AI范畴以致整个学术界缺乏原创性事情的会商,好像从未住手过。究其缘故原由,遍及认为是当下的学术评价系统分歧理。
过度注重文章数量、IF、citation等外貌化、指标化的工具,各年夜高校履行「僵化」尺度评定人材。「论文导向」使患上不少科研课题及研究内容来自“凭空捏造”的欲望,离开现实需求,倒霉在孕育发生从0到1的立异事情,华侈了年夜量的资金投入。「学术评价系统」及「学术潜法则」的两重作用,也许恰是造成李国杰文中所指出的AI研究“顶不了天、落不了地”的缘故原由之一。
但也有人认为,李国杰这番说法“听君一席话,如听一席话”,准确但没有任何引导价值。还有有人认为“如许的话我也会说”,于知乎关在该文会商问题下有如许一条评论:“假如院士的程度,于2021年给出了顶不了天,立不了地的病情诊断;那末他应该马上给出‘怎样顶天,怎样登时,为何顶不了?为何立不住?’的医治方案。”
面临质疑,李国杰却连结了低调,仅于某微信公号上发表了一则简短的声明。于信息爆炸的时代,这条声明也犹如投入湖中的石子,虽然激起了涟漪,湖水终于也会跟着时间的推移而逐步归在安静。
“我起首是感觉很欣慰,由于年青人愿意质疑、敢于质疑是功德。”于2021年末召开的GAIR 2021 年夜会上,李国杰告诉雷峰网。
李国杰作为佳宾介入了GAIR 2021“并行计较与体系布局40年”记念圆桌的现场会商。会后,李国杰与雷峰网举行了一次对于话,评述了计较机科学及人工智能理论研究持久以来存于的“不以解决问题为导向”的偏向,对于“顶不了天、落不了地”做了进一步解读:AI的“顶天”及“落地”指的是AI不仅要解决已经有运用中的一些小问题,更要解决NP-hard级另外年夜问题,而咱们今朝于人工智能的研究标的目的计划上常见的问题是,要末不敷“顶天”,要末难以“落地”。
这傍边有汗青的缘故原由,也恰是他但愿提示研究者们应该留意之处。
如下为雷峰网收拾的对于话实录,雷峰网(公家号:雷峰网)做了不转变原意的编纂:
2“顶不了天,落不了地”激发的争议雷峰网:咱们先从您2021年8月的一篇“顶天登时”的文章提及。其时您的文章发表后引起了业内的广泛会商。
李国杰:实在其时我已经经发表了一个声明,我其实不是对于中国AI研究近况做定论。文章的原标题是《人工智能运用取患上庞大结果的启迪》,重要是论述AlphaFold于生物范畴的冲破性进展带给咱们的启迪,相干报社认为标题承平淡,未经沟通,便把标题问题改为《海内AI研究“顶不了天、落不了地”,该想一想了》。
我于文章中提到的问题是指,今朝海内很多年夜学及企业已经经感触感染到“顶不了天又落不了地”的困扰。但愿各人于选择AI研究标的目的上“多动头脑”,AlphFold 2取患上乐成的重要缘故原由是DeepMind团队眼光敏锐地认定,用人工智能可以解决卵白质布局猜测问题。标的目的自己具备前瞻性、挑战性,并且解决后意义庞大。我国启动的新一代人工智能庞大科技项目,开展了数据智能、跨媒体感知、群体智能、类脑智能、量子智能计较等研究,已经取患上不少研究结果,但没有涵盖这类类型的研究。是以,咱们该想一想了。这是提示于选择人工智能做何时要多想一想,不要“随年夜流”。

“顶天登时”的意思是:于技能上要“顶天”,要勇于闯进“禁区”,做他人认为不成能乐成的前瞻研究;;运用上要“登时”,要解决经济、国防设置装备摆设中的年夜问题,也包括用人工智能技能解决基础研究中的挑战性问题。
雷峰网:对于比海内人工智能的研究,我信赖您的这些见解,也不是一朝一夕就形成的。请问是甚么缘故原由让您存眷人工智能并孕育发生这些设法呢?
李国杰:文章登载后,做AI创业的年青人不平气,我彻底理解,究竟于他们看来我只是一个弄高机能计较的‘老头’,有甚么资历评价人工智能呢?我起首是感觉很欣慰,由于年青人愿意质疑、敢于质疑是功德。
我于许多场所前说过,我算是第二波人工智能的“搞潮儿”之一。

1981年中国科学院硕士卒业后,夏培肃师长教师保举我到美国普渡年夜学攻读博士学位,研究与AI有关的组合搜刮。其时国际AI学术圈中鲜有中国粹者。1984年,我于AAAI年夜会上发表了论文,AAAI那时还有是美国海内的人工智能协会(American Association for Artificial Intelligence,2007年AAAI改称为国际性的进步前辈人工智能协会,Association for the Advance of Artificial Intelligence),名气不像此刻这么年夜,于会上我没有碰到从海内到美国德克萨斯州奥斯丁来开会的学者。
1985年,同我的导师华云生传授,咱们配合编著了一本自学参考书(Tutorial)《Computer for Artificial Intelligence Applications》,持续三年景为IEEE最脱销出书物,其时新进入智能计较机范畴的学者年夜多看过这本文集。于书中我没有利用「智能计较机」(intelligent computer)一词,而是采用「合适人工智能运用的计较机」,其时很难做出真正意义上的「智能机」,只可以讲是将计较机运用在人工智能。1987年我回国事情,前后出任中科院计较所研究员及国度智能计较机研究开发中央主任,也将重心放于高机能计较研究上。但我从未住手过对于 人工智能 的存眷。

李国杰与导师配合编写的册本
雷峰网:可以说您见证了我国人工智能学科的发展及成长,最初人工智能于咱们国度是甚么样的环境?
李国杰:我国人工智能的成长是走过一段弯路的。最早的人工智能学会不于中国科协系统里,而是于社会科学这个别系中,挂靠于中国社会科学院下面。(关在中国人工智能学会建立的初期故事,于行将出书的《中国人工智能简史(第一卷):致敬传奇》中有更具体描写)。
863规划早期,我曾经是智能机专家组(306主题)的副组长。根据专家组的定见,戴汝为(中科院院士、闻名节制论与人工智能专家)及我出头具名联结天下的人工智能学者,试图创建天下年夜结合的人工智能学会,跟全球主流人工智能学会对于标,归属到科协系统里,但此事没能做成。其时咱们的人工智能研究与国际上主流的人工智能是不接轨的,一样是做人工智能,各人存眷的工具有着差别的发力点。
雷峰网:您这篇文章里提到AlphaFold于生物范畴做出了一些成绩。您是怎样想到用AlphaFold举例子的呢?
李国杰:我对于生物范畴的相识,是始在我的学生卜东波,他是这方面的专家。于AlphaFold 2问世之前,海内外有不少科学家于做用计较机猜测卵白质三维折叠布局的研究。卜东波团队2020年于Nature Co妹妹unications期刊发表论文,于卵白质布局猜测方面做出了世界领先的结果。他做出来的几个代表性猜测成果比AlphaFold要好,AlphaFold于CASP角逐中的GDT患上分约为50多分,卜东波能做到70分。厥后AlphaFold 2 做到90分就跨越他了。
为何以AlphaFold为例?这是基在我对于人工智能的一个基本判定:人工智能不仅要模拟人,更要解决年夜问题。从计较机科学的角度来说,人工智能应该存眷NP-hard级另外难题。咱们现有的人工智能研究,要末不敷顶天,只能解决小问题,要末难以落地,难以于现实场景中获得运用。
3“人工智能是拿来解决年夜问题的”
雷峰网:您此条件到,学术界的人工智能研究过度局限在约翰·麦肯锡的界说,也就是人工智能的方针是“像人”,并指出咱们应该冲破对于智能的狭义理解。这与AI要解决NP-hard级别难题有甚么接洽?
李国杰:“像人”的人工智能是一个已经经被各人很器重的标的目的,但我认为人工智能的另外一个发力点是「解决年夜问题」。特别是用呆板进修的要领解决意义庞大的科学难题,即于多项式时间内“有用解决”指数繁杂性问题。
所谓指数繁杂性是指求解一个问题所需的时间或者空间(存储用量)跟着问题范围增长而指数性地增长。这也就人们常说的组合爆炸。于计较繁杂性理论中,将一年夜类今朝还有找不到多项式级繁杂性算法的问题划归为NP-hard问题。假如一个问题能找到多项式级繁杂性的算法,例如排序算法等,直接按确定的步伐计较就能切确求解,人们一般不认为是人工智能运用。人工智能要研究的问题险些都是NP-hard问题,从其降生最先就要敷衍组合爆炸。从这类意义上讲,人工智能的“天”就是组合爆炸,所谓“顶天”就是找到巧妙的措施降服组合爆炸。
颠末60多年的人工智能研究,敷衍计较机视觉、听觉、呆板翻译等范畴的组合爆炸已经取患上使人满足的前进,但于基础研究及现实运用中还有有年夜量的NP-hard问题等着咱们去冲破。跟着氨基酸单体的增长,卵白质布局猜测的计较繁杂度呈指数级上升,假如用野蛮搜刮,卵白质布局猜测的可能组合高达10的几百次方,这是典型的NP-hard问题。如今的“洽商”的芯片设计问题也是NP-hard问题。中国科学院计较所正于摸索用“芯片进修”代替“芯片设计”,这多是破解芯片设计人材缺口的前途。
这些才是真实的年夜问题,人工智能研究要顶天,就必需进入这些已往认为不成能的“禁区”。
难以落地是“不为也”,“非不克不及也”
雷峰网:上述您提到的两个例子,卵白质布局猜测及EDA都是运用价值很高的问题。您认为只要专注NP-hard级另外难题,就能够让人工智能研究既可顶天又能落地吗?
李国杰:还有不敷,这瓜葛到计较机科学界的一个“传统”。有一本经典的关在NP问题的研究生教材《Computers and Intractability: A Guide to the Theory of NP》。书里第一页就是幅漫画,画中两小我私家于对于话,一小我私家说:“我找不到有用的算法,但所有这些最优异的人也找不到”(见下图)。这实在代表了计较机理论界对于NP-hard问题的立场。

直到50年后的今天,这一“传统”仍于连续影响着一代又一代计较机科学范畴的学者。人们都于冒死证实“这个问题是否是NP-hard”。只要是NP-hard问题, 就没有‘咱们’的责任了,而再也不想有无甚么措施解决坚苦问题,这是很风趣的场合排场。其他学科都于努力解决各类难题,惟独计较机科学成天于会商甚么问题解决不了。
只纠结在理论界限的证实,而不去想措施解决问题,这是咱们没法让坚苦问题落地的底子缘故原由。几十年来,咱们将NP-hard问题视作障碍,认为这是咱们没法解决的问题。可是跟着人工智能及计较机技能的前进,咱们发明经由过程开导式搜刮、常识工程及呆板进修,加之充实年夜的算力,许多NP-hard问题可以获得满足的解。NP-hard象征着不成能的时代已经颠末去,NP-hard只是象征着可能没有始终有用及可扩大的算法罢了,但很多NP-hard问题对于在运用而言现实上有可以解决。人工智能学者的使命就是掘客出貌似不成能中的可行方案。
我这里讲的用人工智能解决NP-hard问题,不是指理论意义上的“解决”。
“P=NP”问题可能几十年内都解决不了,但人工智能学者可以于实践中不停迫近这个等式。计较机科学界已往偏向在做理论上的完善证实,也许是厥后人曲解了图灵的用意。图灵界说了不成判断问题,例如停机问题,指出这一类问题永远不成能用图灵机解决,这就规定了图灵机的能力界限,反过来也就界说了甚么是可计较问题。这个结果自己很伟年夜,但厥后许多人却从过错的标的目的理解图灵机,他们执着在前者,热中在切磋甚么问题“理论上”不成计较或者于可接管的时间空间内不成计较,而不是去踊跃摸索怎样“现实上”解决难解的问题。
这类熟悉上的误区来历在没有区别“问题”及“问题实例(Problem instance)”。计较机科学中要求解的“问题”是指包罗各类实例的一个问题类,而人工智能运用要解决的“问题”往往是详细的问题实例。现实上,一个指数繁杂性问题(类)中最难解的凡是只是此中很少的实例,其他的实例都是可以求解的。
呆板进修的黄金时代
雷峰网:近几年深度进修很火,呆板进修是否是解决NP-Hard问题的有用路子呢?
李国杰:计较历程中有繁杂性就犹如物理运动中有磨擦力同样,磨擦力不成能彻底消弭,繁杂性也不成能彻底消弭。但磨擦力可以经由过程转变质料及运动方式削减,求解要领的现实繁杂性也能够经由过程转变问题的描写方式或者常识的暗示方式而转变。今朝广泛风行的深度神经收集对于一个问题的描写与已往的符号推理彻底差别,深度神经收集经由过程呆板进修得到的毗连权重漫衍现实上是一种新的问题及常识暗示方式,已经经体现出史无前例的问题求解能力。
人工智能界风行一种说法:深度进修已经经遇到天花板。但我认为深度进修还有有成长空间,更广义的呆板进修的巨年夜成长空间难以估量,此后十年多是呆板进修的黄金时代。呆板进修尤其是深度进修对于在人类常识依靠性较低,可以运用到多种类型的NP-hard问题求解中。呆板进修的可扩大性较强,经由过程范围化效应可能不停获得新的发明。人工智能是一门寻求得到“使人惊奇”成果的学问,我信赖将来十年会有很多“使人惊奇”的新结果不停冒出来。
人有“人智”,机有“机智”,常识的规模将扩展到“明常识”及“潜常识”之外的“暗常识”。呆板进修、巨年夜算力与已经有科学常识的联合,将鞭策科学研究走向基在人工智能技能的年夜平台模式,科研的深度及效率将跨越仅仅是数据驱动的“科研第四方式”。此刻已经隐隐看到新的“科研第五范式”的雏形。
人工智能离不开计较思维,但又不等同在计较思维。图灵界说的计较(算法的履行)是输入到输出的函数映照,其成果必然是反复一致的,这类“计较思维”必然水平上限定了人工智能研究的创造性。“图灵机”不是指一台“呆板”,而是指一台呆板的一个特定的运行历程或者利用方式,包括对于初态及终态的划分。呆板进修的输出属性往往要按照履历及处境而定,一个不停进修的体系是不反复先前的内部状况的。“计较”的观点不足以涵盖所有智能及认知历程。简朴地划分“易解”及“难解”问题的传统计较繁杂性理论的框框也需要冲破。

图灵机模子
4人工智能研究需要战略目光及“咬住不放”的毅力雷峰网:您曾经说海内学者与一流科学家程度还有有较年夜间隔,像AlphaFold2项目的乐成,您认为是他们于选题时「眼光敏锐」。但不是说随随意便就能够找到一个好科研课题,请问您感觉我国粹者该怎样造就科研中的「敏锐眼光」?
李国杰:所谓“眼光不敷敏锐”,指的就是结构的科研项目要末是增量式的技能改良,即顶不了天,要末是几十年都难以冲破的抱负型方针,即落不了地。DeepMind学者使用AI猜测卵白质折叠布局,充实表现了超前的预感性,值患上咱们寻思。
怎样拥有「敏锐眼光」是学术界的浩劫题,也是所谓「巨匠」及「二流学者」的区分。真谛往往于少数人手里,真正能看准科研标的目的的科学家很少,并且科研中谁开始得到庞大的新发明也有偶尔性。但“随年夜流”是当前科研中比力遍及的征象,一般而言, 追热门,随年夜流做不出年夜成就。
「敏锐眼光」是一小我私家综合本质的表现,不仅是科学素养,还有包括人文情操。闻名数学家丘成桐师长教师说过:“中国的理论科学家于原创性还有是比不上世界开始进的程度,我想一个主要的缘故原由是咱们的科学家人文的涵养还有是不敷,对于天然界的真及美情感不敷富厚。”
「敏锐眼光」不是一个拒绝趁波逐浪的刹时节点,而是纵向延长的时间线,节点前是对于行业的深刻洞悉及看法,节点后是守患上云开见月明的刻意。取患上原创性的庞大科研结果不仅需要才学过人、敢为人先,并且需要“咬住不放”,始终如一。
咱们都知道图灵奖患上主Geoffrey Hinton,他得到承认的暗地里是30年的默默对峙。其时美国主流学术界不看好深度进修,几经展转,研究经费捉襟见肘的Hinton只能去加拿年夜。2006年Hinton终究一举成名,于《科学》上发表文章。到2012年,Hinton与他的学生Alex Krizhevsky,夺患上ImageNet年夜范围视觉辨认挑战赛冠军,深度进修才患上以被人留意,并从此年夜放异彩。
5于基础研究中要器重阐扬工程技能的作用雷峰网:您曾经暗示,AlphaFold并无提出新的科学道理,它更像一个集成事情。于文章中您也提出工程学技能不是东西,不单单是基础研究结果的运用,而是于基础研究中可以阐扬巨高文用的主要构成部门,您是感觉咱们此刻对于工程技能还有不太够器重吗?
李国杰:不是。咱们国度做工程的人不少,但于用工程化措施解决基础科学问题方面,是有些脱节的。我的意思是,构造数十人甚至数百人协同解决庞大基础研究问题的能力有待提高,于基础研究中要器重阐扬工程技能的作用。但于AI 海潮之下,最近刷分刷榜的工程实现好像看患上过重了,而纰漏了对于纪律自己的挖掘,这也是值患上留意的。
AlphaFold团队是一个典型的跨学科互助团队,于《天然》发表此庞大结果的论文作者有34位,此中19位并列第一作者,包括呆板进修、语音及计较机视觉、天然语言处置惩罚、份子动力学、生命科学、高能物理、量子化学等范畴的知论理学者。卵白质形成不变折叠布局的缘故原由是份子内部的势能会降到最低点,猜测计较现实上是能量最小化的优化,这触及很多范畴的常识。
AlphaFold2并无于卵白质布局的组成机理上有新的发明,而是于工程上可以或许更快、充足正确地做出比他人好患上多的猜测,获得生物学界的承认,今朝是最佳的方案。
得到庞大科研结果的方式跟已往纷歧样了,之前一小我私家冥思苦想就能做出成就来,此刻需要跨学科互助、强盛的工程力支撑才能把工作做到,以是工程技能此刻是基础研究的一部门事情了。
6拼搏,安好
雷峰网:假如让您用两个词语来形容本身,您会选择甚么词呢?
李国杰:“拼搏”及“安好”吧。不管是我小我私家发展履历,还有是研制 曙光 及 龙芯 等项目,假如脱离了 拼搏 精力,今天的种种结果都不复存于。但我被选院士之后,久别相逢的年夜学同窗问我此刻寻求甚么?我的回覆是:“我于寻求安好”。“拼搏”及“安好”看起来彼此抵牾的两种境地于我心中是同一的。
从读高中最先,我的糊口门路崎岖不服,对于在升官发达、飞黄腾达从未有过奢望,只想于安好的糊口中寻求明哲保身。林则徐的“壁立千仞,无欲则刚;海纳百川,有容乃年夜”,及诸葛亮的 “恬澹以明志,安好而致远” ,这两对于条幅一直是我的座佑铭。
现实上,我是一个很普通的人。
我这平生并无攀上科技岑岭,做出惊人的科研结果。我很清晰本身不是一个尤其智慧的人,能力也不是尤其强。幸亏我履历患上比力多,挫折比力多,以是不患患上患掉,认准方针就不会中途而废。看问题不太受小工作的滋扰,心田有一股劲,就是要把工作做成,不达方针不甘愿宁可。
我说的“安好”不是指如本年轻人常说的‘佛系’。此刻收集中风行的‘佛系’是指一种 “无欲无求,对于甚么都不于乎”的立场。我认为对于好的事物还有是要寻求的,只是莫为争名夺利虚度了工夫。不忘初心,不负任务,脚下的路就会越走越宽。
参考资料:
潇湘晨报《年夜国院士入莞十五载》
雷峰网雷峰网雷峰网原创文章,未经授权禁止转载。详情见转载须知。





