米兰·(milan)中国官方网站-今年的海德堡论坛，Raj Reddy、Sanjeev Arora、LeCun 与 Bengio 都讲了些什么？

作者：米兰·(milan)文化更新时间：2026-03-14 12:07:04 点击数：

作者 | AI 科技评论

编纂 | 陈彩娴

跟着算力的日趋提高及研究的不停堆集，深度进修的成长已经经走向运用，给各行各业带来了深刻的影响。怎样从模子的设计及部署两方面让 AI 越发向善，这是构建深度进修东西及利用东西的人都需要思量的问题。

于如许的配景下，三位图灵奖得到者 Raj Reddy、Yoshua Bengio、Yann LeCun 及 2011 年 ACM 计较奖患上主 Sanjeev Arora，以和多位学者，于本年玄月举办的第九届海德堡获奖者论坛上带来了一场关在深度进修的运用与影响的会商。

今年的海德堡论坛，Raj Reddy、Sanjeev Arora、LeCun 与 Bengio 都讲了些什么？

1深度进修的观点于变化

Yann LeCun：我感觉有一个很笼统的界说，即经由过程组装那些函数没有被彻底界说的组块来组装一个呆板，然后经由过程利用梯度降落最小化某种方针函数来解决这些函数。

这个笼统的界说合用在许多环境，不单单是神经收集，而且可能还有与上世纪 50 年月的单一处置惩罚（single processing）及模式辨认有共通的地方。

这些年来，深度进修的观点已经经有所蜕变，也简直有人提议从头予以定名。可微分编程（differentiable progra妹妹ing）这个观点可以被泛化地舆解为深度进修，其寄义是编写一个步伐，此中函数挪用不被彻底界说，而是于练习中加以调解。

Sanjeev Arora：我之前研究算法及计较繁杂性，约莫于 2011 年，就于深度进修发作的前一年，我转向了呆板进修。

LeCun 适才谈到的范式是，你有一个成本函数（cost fucntion），并于历程中加以调解，这就是深度进修。问题是，成本函数其实不能真准确定神经收集所做的工作，从不异的成本函数中，你也能够得到其他许多工具。以是这类范式其实不老是遭到承认。此刻它于理论上已经经被证实了，实在是算法的隐式误差。

今朝咱们还有不清晰最底层发生了甚么，以是我认为，假如仅利用成本函数来推理深度收集，多是过错的，咱们需要更多地相识黑箱内部所发生的工作。抱负环境下，咱们为此需要一个更广泛的关在练习算法的隐式成见的理论。由于练习算法、架谈判成本函数组合于一路，才带来了咱们所看到的成果。咱们并未把握完备的理论，但这类理论是十分主要的，由于当前咱们利用深度进修的重要方式是于无标签数据的环境下练习模子，然后泛化到其他使命。这类方式不合用在任何现有的理论框架。以是咱们必需真正深切黑箱。

Shakir Mohamed：咱们有两种理解呆板进修的方式。一种是关在利用练习、算法、架谈判成本函数；另外一种是将呆板进修理解为创立一个模子。模子是一种描写世界的方式，包括数据是怎样天生的、咱们怎样不雅察数据、咱们指望看到甚么样的猜测，这类方式我称之为「推理」（inference）。

怎样将数据转化为更新参数的方式？对于在任何推理要领，研究统计或者几率的人凡是利用的一种要领是最年夜似然。对于在咱们所利用的任何一种模子布局，均可获得一种算法。深度进修的魔力于在基在组合性、递归性、架构深度、特定类型的丧失函数、梯度降落算法，对于特定类型的模子举行特定的选择。

以是我认为，那些对于几率感兴致、做推理思索的人应该把分化作为其阐发东西，即对于在如下问题做分化：你正于成立的是甚么模子？为何要成立这个模子？将数据转化为看法的推理历程是甚么？你现实利用的算法是甚么？

对于在所有这些问题中的每个，你均可以将其视为一个对于象，对于其做阐发、做理论研究或者是实证查验。或者者你也能够将其放于一路研究。

我认为这类模子很是有效，它将呆板进修理解为一个广泛的范畴。呆板进修其实不仅仅是获取数据、跑代码、利用 scikit-learn、做一些猜测，要体贴咱们真正于做的是甚么。

Yoshua Bengio：我很是赞成 Shakir 及 Sanjeev 的不雅点。我想夸大的是，咱们需要对于咱们于各类深度进修实现及架构中投入的归纳误差有更多成心识的理解。抱负环境下，于设计阶段，咱们该当思量函数或者漫衍空间中的偏好是甚么，并将这些偏好引入到方针函数以外的进修中。这对于设计下一代深度进修体系也成心义。

深度进修常常被吐槽的一个点是它的推理能力。有一种不雅点认为，深度进修不克不及像人类那样做真实的推理，由于人类利用的是年夜脑中的某些神经收集。我赞成，但我信赖，可以经由过程引入归纳误差，将布局融入这些架谈判对于象中，从而激发近似在人类的推理。

2深度进修的推理能力

发问：我从事主动驾驶体系及主动驾驶汽车方面的事情，我有两个问题，一是呆板进修技能的可转化性，另外一个问题是怎样把由感知体系孕育发生的详细常识与符号常识接洽起来？主动驾驶汽车怎样防止感知体系过错，好比变化的交通灯。这不会发生于人类身上，人有知识，有一个外部世界的模子可以将感官信息与符号常识接洽起来。

Yann LeCun：我回覆第二个问题。将原始数据、感官数据转换为符号暗示或者者符号种别或者序列。这就是深度进修擅长的。但它仍旧不完善，由于它可能很是懦弱，由于凡是假如它经由过程监视运行的练习，它将被练习用在特定使命。而就于这个使命以外，它不会事情患上尤其好。

咱们还有不太清晰咱们是怎样让深度进修体系做推理的，今朝有许多研究，现实上我写了一篇关在不雅点论文，几个月前放于了网上，试图解决让推理与深度进修相兼容的问题。

今年的海德堡论坛，Raj Reddy、Sanjeev Arora、LeCun 与 Bengio 都讲了些什么？

论文地址：https://openreview.net/pdf?id=BZ5a1r-kVsf

由于深度进修是一种很是强盛的技能，咱们需要让呆板去进修世界模子并得到知识。

Yoshua Bengio：我确凿认为有可能将符号常识与咱们从数据中提取的常识接洽起来，例如设计差别的架构，而且将推理作为此中的主要构成部门。

深度神经收集的竞争力于在，咱们将多个层及模块组合起来，并最先有了留意力机制，但还有需要更多动态组合，准确的常识或者者是高级常识，甚至是符号常识需要被组合起往复做推理，这是将来咱们使用留意力机制的一种路径，不外这仍是一个很是开放的问题。

Sanjeev Arora：Yoshua 你谈到了自治体系，似乎这些体系是于很多时间段或者于无穷的时间里运行，但咱们还有不清晰是否对于体系的决议计划做出连续性的注释，由于它是一个动态步伐。而人类拥有注释这些决议计划的所有捷径，谁知道这些捷径是否有效？

Yoshua Bengio：你于差别的国度只能靠左行驶或者靠右行驶，咱们可以对于符号法则做近似的处置惩罚。

Sanjeev Arora：是的，但还有有一个问题是，当你说到动态决议计划时，并无简便的注释来理解为何它是准确的。

Been Kim：以某种方式将符号逻辑与深度进修架构相联合，对于在注释能力及可注释性方面的研究很是有效。但我认为，咱们有一个过错的假定，即于咱们的世界中，存于在人类身上的符号足以理解繁杂的主动驾驶汽车及其他繁杂体系。于这类假定下，问题就酿成了假如咱们要将这个繁杂的神经收集正于做的事类似为对于咱们成心义的符号，这类类似是否充足好？咱们怎样判定它什么时候不敷好？为何会掉败？假如掉败了，它会告诉咱们怎样修复吗？我认为这是一个很是主要的问题。

发问：请问 Bengio 传授，您提到了推理及归纳误差的须要性，我小我私家更可能是于顺应差别模态的空间中处置惩罚归纳误差，我想知道您于这方面是怎么做的。

Yoshua Bengio：咱们于人类推理中看到的一些归纳误差涵盖了如许一个事实：当咱们于高条理长进行推理时，咱们于成立观点之间的因果瓜葛、观点之间的瓜葛，并形成一个很是稀少的图（graph）。假如我丢下一个球，它就会落于地面上，像如许很是正确的猜测是于高条理上的，触及的变量很少，这就跟你于像素级别上可以或许履行的操作很是差别。

此外，于这个高条理上，咱们反复利用这些观点及组件来形成新的序列、新的意义，咱们还有不知道怎样做好重用动态及重组，但咱们可以将这类归纳误差设计到神经收集中。

人类高条理理解的另外一个方面是因果瓜葛，因果瓜葛于漫衍泛化及咱们关在用意的思索方面起作用，用意也就是人类想要做的工作以和于高条理上与干涉干与相干的举动，以是这跟强化进修有许多联系关系。咱们还有需要做更多的事情，去将归纳误差它们整合到架谈判练习对于象中。

人类擅长推论及推理，但咱们其实不是完善的推理呆板，理解咱们掉败的推理模式也很主要。咱们也许可以从生物学中获取线索，帮忙咱们摸索怎样将这些归纳误差引入神经收集。

3开放式偕行评审：从 ICLR 谈起

发问：自建立以来，ICLR 的开放式偕行评审要领都很是非凡，这对于在 AI 范畴学术研究成长是否孕育发生了影响？ICLR 最早的年夜会主席 Yoshua 及 Yann 都于这里，咱们先从 Yann 最先。

Yann LeCun：2000 年末到 2010 年头，其时人们审慎地会商该怎么准确地举行偕行评审，计较机科学集会的偕行评审很有些随机，但这不克不及怪罪在履行偕行评审的人，由于这就是它的素质，并且这个范畴的快速成长也决议了这一点，年夜大都人于范畴内的经验都是有限的，以是年夜大都审稿人有时会是博士生，有时是硕士生。他们更可能是要找出一篇论文的错误谬误而非长处，并且不能不拒绝许多论文，咱们许多人都为此感应惭愧。

我跟 Yoshua 已经经会商了频频，论文或者预印本与于出书机构或者评审机构之间的垄断瓜葛已经经被打破，以是任何评审机构，不管是集会还有是期刊，均可以评审任何论文，而且任何论文也均可以哀求评审机构举行评审。假如您想要获取看法及评论，偕行评审就像是一个开放的市场，正确度、猜测性或者诺言度，对于评审机构都有晋升作用。

我于我的网站上写了一篇关在这个的文章，并于马萨诸塞年夜学阿默斯特分校及 David McCallum 会商，他正于做 OpenReview 的事情，OpenReview 相称在是一个实行偕行评审的基础举措措施。

按照pin实体的正确度或者猜测性，或者者近似的工具或者它们的诺言度来晋升审查实体。以是我于我的网站上写了一篇关在这个的文章，然后最先及年夜卫麦卡勒姆会商你。U mass，amherst，由于它正于开展公然审查，公然审查基本上是可用在实行这些设法的基础举措措施。

2013 年，咱们住手了运行了十年的 wrokshop，并最先启动 ICLR。咱们扣问 OpenReview 咱们能不克不及实行偕行评审体系，现实上其实不可能实行整个体系，但咱们取患了一些乐成。

主要的是，评审是开放的，以是评审人会写评论，并被所有人看到，提交的论文也是所有人可见。这不是双盲，而是单盲，官方审稿人是匿名的，可是任何人均可以选择于本身的名下为所有论文写评论。

有一名对于这个历程感兴致的社会意理学家举行了一项查询拜访，好比扣问人们与经典模式比拟会更喜欢这类模式吗？他们都回覆是的，这个结论很是明确。

但终极当其别人构造 ICLR 时，咱们其实不能去告诉步伐委员会该怎样构造集会，由于他们是自愿的脚色。以是评审历程又逐渐地愈来愈靠近在更传统的模式，除了了 OpenReview 患上以保留。

而此刻，其他集会也都转换到这类模式，包括 NeurIPs 及 ICML，我认为这是一个前进。于开放性的另外一个方面，我认为 Yoshua 及我对于引发 AI 社区研究的的快速发表孕育发生了庞大影响。有如许一句话：早发表，高发表。论文可能有过错，可是不妨，有时机改正。

发问：Yoshua，联合你于 ICLR 的经验，对于在那些除了了本身的研究以外还有介入构造事情的年青研究职员，你有甚么要做及不要做的建议？

Yoshua Bengio：我先就 Yann 的回覆再增补一些配景。呆板进修研究者社区几十年来于开放科学及开放出书方面一直是踊跃份子，我及 Yann 一直于鞭策 ICLR。

于 1999 年摆布，《呆板进修期刊》(Machine Learning Journal)的委员会发生了一场小革命，委员会成员及研究者包括我本身于内都于鞭策更多的开放获取，可是构和并无乐成，委员会的很年夜一部门成员脱离了。咱们开办了此刻呆板进修旗舰期刊——The Journal of Machine Learning Research (JMLR)，是社区治理的非营利构造。

有时科学上的需要及科学家追求的真谛价值不雅以和为社会做一些踊跃的工作，其实不老是与利润最年夜化相一致。我认为有抱负的年青人，例如倡议 Climate Change AI (CCAI) 的小组，于集会上申请构造钻研会，凡是是年青人新群体将精神投入到这些工作中。有时他们可以本身开办一个集会，要做到这一点需要支付事情及努力，需要招集一多量体贴这个话题的人。

Yann LeCun：google学术显示，自 2013 年以来，ICLR 于所有出书机构影响力排名中已经经位列第七位，领先在 PNAS，这长短常了不得的，这要归功在彻底开放的评审历程。

4环保的 AI 与低碳年夜模子

发问：此刻模子愈来愈年夜、愈来愈繁杂，而年夜模子会耗损更多的能量及资源。跟着时间的推移，这会致使天气愈来愈糟糕糕，并且模子好像不会住手变年夜。于测验考试构建更高效的模子时，是否有任何东西、步伐或者其他办法来避免这类环境发生呢？

Sanjeev Arora：咱们可以从练习及部署两方面来看，于部署阶段，咱们可使模子越发紧凑，但于练习方面，咱们确凿偏向在把模子做患上愈来愈年夜。

Yann LeCun：实在分三类，有研究培训、出产培训以和部署。部署是迄今为止最年夜的能源耗损源。有一篇很是有趣的论文，是google的员工做出了某种猜测，猜测关在于google如许的于线办事中破费于 AI 上的能源与其他所有能源的比例是几多。事实上比例不是很年夜。以是能源耗损的数字正于变年夜，但它变年夜的速率不是很快。今朝，这个数字年夜概是 15 - 20%，并且不会凌驾这个规模，由于遭到了经济的限定，并且所有那些至公司都于能源上破费了年夜量的钱，这象征着他们有巨年夜的动力去节省能源。

Been Kim：蒸馏是一个可以存眷的要害词。蒸馏可以将繁杂收集变患上更小、更容易在理解、更稀少。稀少收集也是一个值患上存眷的要害词。并且我还有想增补一下，于建造、部署模子的时辰，于像google如许的公司中，简化模子这一点长短常主要的。由于模子越繁杂就越难维护，更难理解，即便对于咱们来讲也很难。是以，咱们一直于努利巴模子做患上更好、更简朴。

Yann LeCun：有很是重大的工程师团队投入所有精神去做这个事情，他们的努力使患上部署中的推理越发高效。

发问：有一个相干的问题是，咱们怎样确保有相干的激励办法令人工智能的前进可以或许直接解决天气危机方面的问题？

Shannon Vallor：我认为有须要思量一下，当咱们还有不克不及将 AI 用在所有工作的时辰，咱们要利用 AI 来优先解决甚么问题？天气危机的加快速率比预期的要快，影响正变患上比预期的更严峻。以是我认为咱们需要确保对于人工智能运用及部署的投资激励与应答天气危机的需要相当。

Yann LeCun：google Alphabet 及我于利用人工智能应答天气变化方面有互助过一些项目。例如咱们做了一个开放式协作项目，其设法是利用人工智能来找出有用地将氢与氧从水中分散出来的要领。

只要能有用地年夜范围贮存能量，咱们就有了应答天气变化的解决方案。咱们可以用太阳能电池板笼罩一个小戈壁，用水产出氢气后，将能量以甲烷的情势输送到需要之处。从此咱们将再也不需要化石燃料。该项目仅活跃了约莫一年，但它是一个任何人均可以介入的开放项目。我认为人工智能于质料科学及化学中的运用很是有远景。

Yoshua Bengio：咱们简直采纳了某些办法，但正如 Shannon 所说，这些办法还有不敷。要解决这个问题的话，必需要由当局来推出政策。可以或许解决这个问题的不是小我私家，甚至不是个体公司，而是当局。只有当局能于地球的层面上用最抱负的方式做到。咱们需要鼓动勉励当局。并且这么做不单单是由于天气，我于感染病、医疗等范畴也碰到过近似的问题。

视频链接：https://www.youtube.com/watch?v=dyOxLRr_Zbs

更多内容，点击下方存眷：扫码添加 AI 科技评论微旌旗灯号，投稿进群：今年的海德堡论坛，Raj Reddy、Sanjeev Arora、LeCun 与 Bengio 都讲了些什么？

未经「AI科技评论」授权，严禁以任何方式于网页、论坛、社区举行转载！

公家号转载请先于「AI科技评论」后台留言取患上授权，转载时需标注来历并插入本公家号手刺。

雷峰网(公家号：雷峰网)

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

加入收藏

Tag：米兰·(milan)

上一篇：中国人民抗日战争暨世界反法西斯战争胜利80周年专题（四）

下一篇：暂无

返回列表

米兰·(milan)中国官方网站-今年的海德堡论坛，Raj Reddy、Sanjeev Arora、LeCun 与 Bengio 都讲了些什么？

随便看看

产品推荐

哆啦A梦：伴我同行

八月未央

夏洛特烦恼

风再起时

云飞丝路天