米兰·(milan)中国官方网站-陈怡然最新访谈:通用、可解释的AI计算硬件设计将是EDA的下一项革命性技术
导语:计较新架构、AI计较能效、NSF AI边沿计较中央、电子设计主动化及ACM设计主动化分会、以和将来技能趋向。

作者|李梅
编纂|陈彩娴陈怡然,杜克年夜学电子与计较机工程系传授,美国国度科学基金委(NSF)下一代挪动收集与边沿计较研究院(Athena)主任,NSF 新型与可连续计较(ASIC)校企互助研究中央(IUCRC)主任,杜克年夜学计较进化智能研究中央(DCEI)结合主任。
陈怡然是清华年夜学电子系1994级本科生,2001年得到清华年夜学硕士学位,2005年得到普渡年夜学博士学位。他的研究兴致包括新的影象及存储体系、呆板进修、神经形态计较及挪动计较体系。他曾经发表500多篇论文,出书1部专著,并于各类集会上得到频频最好论文奖。他得到的声誉包括 IEEE 计较机学会 Edward J. McCluskey技能成绩奖、ACM SIGDA办事奖等,并因其对于非易掉性内存技能的孝敬而被提名为ACM Fellow。他还有是美国计较机学会设计主动化尤其兴致小组(SIGDA)主席。
近日,陈怡然传授接管了ACM的采访,分享了他对于在计较新架构、AI计较能效、NSF AI边沿计较中央、电子设计主动化及ACM设计主动化分会、以和将来技能趋向的见解。
AI科技评论对于采访原文做了不转变原意的编译。
ACM:自从您进入影象及存储体系范畴以来,该范畴的成长最使您惊奇的一点是甚么?
陈怡然:我认为,于已往的15-20年里,影象及存储体系范畴发生的最使人高兴的工作,是计较及存储之间的边界变患上恍惚。
现代计较范式的新近革命始在处置惩罚年夜数据的需要,这激发了对于年夜容量存储装备的日趋增加的需求。计较单位及存储装备之间的有限带宽所带来的瓶颈很快就呈现了(凡是被称为「冯·诺伊曼瓶颈」)。使内存及存储体系更「智能」已经经成为减缓体系对于内存带宽的依靠及加速数据处置惩罚的风行解决方案,好比近内存计较及内存计较。
这是一个很好的例子,申明了方针运用步伐的改变(即从科学计较到以数据为中央的计较)怎样转变了计较机架构的设计理念。这类理念的转变引发了各类新的计较产物,如智能固态硬盘(SSD)、动态随机拜候内存(DRAM)及数据处置惩罚单位(DPU),以和很多新兴的内存技能,如3D Xpoint内存(Intel及Micron)。
它也致使了一些新的非冯·诺伊曼架构的呈现,好比基在交织杆的点积引擎,它经由过程直接将计较映照到计较硬件的拓扑布局来履行向量矩阵乘法。
ACM:您近来被援用至多的一篇论文是“Learning Structured Sparsity in Deep Neural Networks”,它论述了提高妙度神经收集效率的主要性。为何提高妙度神经收集的效率很主要?于这一范畴有哪些有远景的研究标的目的?

论文地址:https://dl.acm.org/doi/pdf/10.5555/3157096.3157329
陈怡然:尽人皆知,现代深度神经收集(DNNs)的高(推理)精度陪同着较高的计较成本,这是神经收集的深度及宽度的增长所致使的。然而,咱们也知道,神经收集的毗连权值对于神经收集的精度并无划一的影响。当毗连权值靠近在零时,毗连极可能就能够被修剪(即权值设置为零),而不会以任何方式对于神经收集的正确性孕育发生显著的影响。咱们于NeurIPS 2016上发表的这篇论文注解,进修非零权布局化存储于内存中的稀少神经收集可以连结优良的数据局部性,降低缓存掉误率。是以,神经收集的计较效率年夜年夜提高。所提出的技能,即布局化稀少进修(凡是称为布局化剪接)和其变体已经被广泛运用在现代高效DNN模子设计,并获得很多人工智能(AI)计较芯片的撑持,如英特尔Nervana及NVIDIA安培。
提高DNN的效率至关主要,由于它于很年夜水平上拦阻了年夜型DNN模子的扩大,也拦阻了年夜型模子于计较、存储资源及电力预算有限的体系上的部署,例如Edge及物联网装备。该范畴的最新研究趋向是算法及硬件层面立异的联合,例如,基在新兴纳米装备设计人工智能加快器,用在加快新的或者未开发的人工智能模子,如贝叶斯模子、类量子模子、神经符号模子等。
ACM:近来有动静公布,您将引导美国国度科学基金委果下一代收集与边沿计较人工智能研究院的雅典娜项目(Athena)。Athena项目用时5年,耗资2000万美元,包括杜克年夜学、麻省理工学院、普林斯顿年夜学、耶鲁年夜学、密歇根年夜学、威斯康辛年夜学及北卡罗来纳农业技能州立年夜学于内的几家机构将介入此中。Athena项目的方针是甚么?
陈怡然:咱们对于Athena项目的建立感应很是高兴,它是由美国国度科学基金委及美国领土安全数援助的边沿计较人工智能旗舰研究所。Athena的方针是经由过程提供史无前例的机能及撑持之前不成能实现的办事,同时经由过程进步前辈的人工智能技能节制繁杂性及成本,从而转变将来挪动收集体系的设计、运营及办事。
Athena的研究勾当分为四个焦点范畴:边沿计较体系、计较机体系、收集体系以和办事及运用。咱们开发的人工智能技能也将为将来挪动收集的功效、异构性、可扩大性及可托赖性提供理论及技能基础。
Athena作为社区的毗连点,将促成新兴技能的生态体系,造就多样化的具备品德及公允价值不雅的新一代技能首脑。咱们估计,Athena的乐成将重塑挪动收集行业的将来,创造新的贸易模式及创业时机,并转变将来的挪动收集研究及工业运用。
ACM:设计主动化范畴最使人高兴的趋向是甚么?作为美国计较机学会设计主动化尤其兴致小组(SIGDA)的主席,您认为该构造于这个范畴饰演着甚么样的脚色?
陈怡然:于已往十年中,设计主动化最使人高兴的趋向是于电子设计主动化(EDA)东西中广泛采用呆板进修技能。因为芯片设计质量于很年夜水平上取决在芯片设计师的经验,是以开发智能的EDA东西是很天然的思绪,它可以直接进修怎样从先前已经有的设计中延承半导体芯片的设计要领,而无需再履历一遍传统的粗笨模子。各类呆板进修模子已经嵌入到最新的EDA流程中,以加快计较的实验路由及结构、功率预计、时序阐发、参数调解、旌旗灯号完备性等。呆板进修算法也已经经于芯片的硬件模块中实现,以监测及猜测芯片的运行时功耗。例如咱们的APOLLO框架(得到MICRO 2021 最好论文奖)。

论文地址:https://dl.acm.org/doi/pdf/10.1145/3466752.3480064
作为最年夜的EDA专业协会之一,SIGDA致力在晋升全世界EDA专业人士及学生的技术及常识。SIGDA每一年援助及构造30多个国际及地域集会,编纂及撑持多种期刊及通信,并主理十几场教诲及技能勾当,包括钻研会、教程、收集钻研会、竞赛、研究论坛及年夜学演示。经由过程与咱们的行业伙伴互助,SIGDA还有为年青学生、西席及专业人士提供旅行津贴,以撑持他们到场集会。咱们也颁布一些奖项给社区中的卓异研究职员及自愿者。
ACM:于将来几年里,您地点范畴的研究路子会尤其具备影响力的一个例子是甚么?
陈怡然:我信赖,一个通用的及可注释的AI计较硬件设计流程,将是EDA及计较体系研究的下一个革命性技能。
于已往的十年中,人们提出各类硬件设计来加快人工智能模子的计较。然而,设计者老是于设计的通用性及效率之间挣扎,由于为了顺应不停变化的模子的怪异布局,需要举行很多硬件定制。另外一方面,可注释性一直是确保AI模子的鲁棒性及推广模子设计的一个持久挑战。
将来的AI计较硬件设计可能由各类可注释的硬件模块构成,这些模块对于应它们各自的算法。AI计较硬件的机能由一个通用的设计流程来包管。一种可能的解决方案是利用神经符号化要领构建一个可组合的AI模子,并实现与符号化算法模块相对于应的硬件模块。然后,可使用扩大的AutoML流主动化方针AI计较硬件的设计,从而于包管通用性及可注释性的环境下实现所需的机能。
参考链接:
https://www.acm.org/articles/people-of-acm/2022/yiran-chen

雷峰网(公家号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。





