米兰·(milan)中国官方网站-贝叶斯深度学习：一个统一深度学习和概率图模型的框架

作者：米兰·(milan)文化更新时间：2026-04-01 03:53:29 点击数：

作者 | 王灏收拾 | 维克多

人工智能（AI）的进展显示，经由过程构建多层的深度收集，使用年夜量数据举行进修，可以得到机能的显著晋升。但这些进展基本上是发生于感知使命中，对于在认知使命，需要扩大传统的AI范式。

4月9日，罗格斯年夜学计较机科学系助理传授王灏，于AI TIME青年科学家——AI 2000学者专场论坛上，分享了一种基在贝叶斯的几率框架，可以或许同一深度进修及几率图模子，以和同一AI感知及推理使命。

据先容，框架有两个模块：深度模块，用几率型的深度模子暗示；图模块，即几率图模子。深度模块处置惩罚高维旌旗灯号，图模块处置惩罚偏揣度的使命。

如下是演讲全文，AI科技评论做了不转变原意的收拾：

今天及各人分享关在贝叶斯深度进修的事情，主题是咱们一直研究的几率框架，但愿用它同一深度进修及几率图模子，以和同一AI感知及推理使命。

尽人皆知，深度进修加持下的AI技能已经经拥有了必然的视觉能力，可以或许辨认物体；浏览能力，可以或许文本理解；听觉能力，可以或许语音辨认。但还有短缺一些思索能力。

“思索”对于应推理揣度使命，详细指它可以或许处置惩罚繁杂的瓜葛，包括前提几率瓜葛或者者因果瓜葛。

深度进修合适处置惩罚感知使命，但“思索”触及到高条理的智能，例如决议计划数据阐发、逻辑推理。几率图因为能很是天然的暗示变量之间的繁杂瓜葛，以是处置惩罚推理使命具备上风。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

如上图，概览图示例。使命是：想经由过程今朝草地上喷头开或者关，以和外面的气候来揣度外面的草地被打湿的几率是几多，也能够经由过程草地被打湿反推气候怎样。几率图的错误谬误是没法高效处置惩罚高维数据。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

总结一下，深度进修比力擅长感知类的使命，不擅长推理、揣度使命，几率图模子擅长推理使命，但不擅长感知使命。

很不幸，实际糊口中这两类使命通常为同时呈现、彼此交互。是以，咱们但愿可以或许把深度进修的几率图同一成单一的框架，但愿到达分身其美。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

咱们提出的框架是贝叶斯深度进修。有两个模块：深度模块，用几率型的深度模子暗示；图模块，即几率图模子。深度模块处置惩罚高维旌旗灯号，图模块处置惩罚偏揣度的使命。

值患上一提的是，图模块素质是几率型的模子，是以为了包管可以或许交融，需要深度模子也是几率型。模子的练习可以用经典算法，例如MAP、MCMC、VI。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

给详细的例子，于医疗诊断范畴，深度模块可以想象成是大夫于看病人的医疗图象，图模块就是大夫按照图象，于年夜脑中判定、推理病症。从大夫的角度，医疗图象中的心理旌旗灯号是推理的基础，优异的能力可以或许加深他对于医疗图象的理解。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

引伸一下，影戏保举体系里，可以把深度模块想象成是对于影戏的视频情节、演员等内容的理解，而图模块需要对于用户爱好、影戏偏幸之间的相似性举行建模。进一步，视频内容理解及“爱好”建模也是相辅相成的。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

详细到模子细节，咱们将几率图模子的变量分为三类：深度变量，属在深度模块，假定孕育发生在比力简朴的几率漫衍；图变量，属在图模块，及深度模块没有直接相连，假定它来自在相对于比力繁杂的漫衍；枢纽变量，属在深度模块及图模块中彼此接洽的部门。

下面先容该框架是怎样于现实运用中效果。

保举体系

保举体系基本假定是：已经知用户对于某些影戏的爱好，然后但愿猜测用户对于其他影戏的爱好。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

可以将用户对于影戏的喜爱写成评分矩阵（Rating Matrix），该矩阵很是稀少，用来直接建模，获得的正确性很是低。于保举体系中，咱们会依靠更多的信息，例如影戏情节、影戏的导演、演员信息举行辅助建模。

为了对于内容信息举行建模，并举行有用提纯，有三种方式可供选择：手动成立特性，深度进修全主动成立特性、采用深度进修自顺应成立特性。显然，自顺应的方式可以或许到达最佳的效果。

不幸的是，深度进修固有的自力同漫衍假定，对于在保举体系是致命的。由于假定用户及用户之间没有任何的联系关系的，显然是过错的。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

为相识决上述坚苦，咱们推出协同深度进修，可以或许将“自力”推广到“非自力”。该模子有两个挑战：

1.怎样找到有用的几率型的深度模子作为深度模块。但愿该模子可以或许及图模块兼容，且及非几率型模块的效果不异。

2.怎样把深度模块毗连到主模块里，从而举行有用建模。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

来看第一个挑战。自编码器是很简朴的深度进修模子，一般会被用于非监视的环境下提取特性，中间层的输出会被作为文本的暗示。值患上一提的是，中间层的暗示它是确定性的，它不是几率型的，及图模块不兼容，没法事情。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

咱们提出几率型的自编码器，区分于在将输出由“确定的向量”变换成“高斯漫衍”。几率型的自编码器可以退化成尺度自编码器，是以后者是前者的一个特例。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

怎样将深度模块与图模块相接洽？先从高斯漫衍中提出物品j的隐向量：

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

然后从高斯漫衍中，提掏出用户i的隐向量：

贝叶斯深度学习：一个统一深度学习和概率图模型的框架基在这两个隐向量们就能够从别的高斯漫衍采样出用户i对于物品j的漫衍，高斯漫衍的均值是两个隐向量的内积。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

上图蓝框暗示图模块。界说了物品、用户、评分等等之间的前提几率瓜葛。一旦有了前提几率瓜葛，就能经由过程评分反推用户、物品的隐向量，可以按照“内积”猜测未知的配景。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

上图是整个模子的图解，此中λ是节制高斯漫衍方差的超参数。为了评测模子效果，咱们用了三个数据集：citeulike-a、citeulike-t、Netflix。对于在citeulike是用了每一篇论文的标题及择要，Netflix是用影戏情节先容作为内容信息。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

试验成果以下图所示，Recall@M指标暗示，咱们的要领年夜幅度逾越基准模子。于评分矩阵越发稀少的时辰，咱们模子机能提高幅度甚至可以更年夜。缘故原由于在，矩阵越稀少，模子会越发依靠内容信息，以和从内容提掏出来的暗示。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

保举体系机能晋升可以或许晋升企业利润，按照麦肯锡咨询公司的查询拜访，亚马逊公司中35%的业务额是由保举体系带来的。这象征着保举体系每一晋升1%个点，城市有6.2亿$的业务额晋升。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

小结一下，到今朝为止，咱们提出了几率型的深度模子作为贝叶斯深度进修框架的深度模块，非几率型的深度模子实在是几率型深度模子的特例。针对于深度的保举体系提出层级贝叶斯模子，试验注解该体系可以年夜幅度保举体系的效率。

其他运用设计

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

给定一个图，咱们知道边，并相识节点的内容。此图假如是社交收集，实在就是暗示着用户之间的伴侣瓜葛，节点内容就是用户贴于社交平台上的图片或者者文本。这类图瓜葛，也能够暗示论文的标题、择要、援用等等接洽。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

咱们的使命是但愿模子可以或许进修到节点的表达，即可以或许捕捉内容信息，又可以或许捕捉图的信息。

解决方案是基在贝叶斯深度进修框架，设计瓜葛型的几率自编码器。深度模块专门卖力处置惩罚每一个节点的内容，究竟深度进修可以或许于处置惩罚高维信息是有上风的；图模块处置惩罚节点节点之间的瓜葛，例如援用收集以和常识图谱繁杂的瓜葛。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

于医疗范畴，咱们存眷医疗监测。使命场景是：家里有小型雷达，会发射旌旗灯号，设计的模子但愿可以或许按照从病人身上反射的旌旗灯号，发明病人是否定时用药、用药的秩序序是否准确。问题于在：用药的步调很是繁杂，需要理清挨次。

基在贝叶斯深度进修几率框架要领，用深度模块处置惩罚很是高维的旌旗灯号信息，用图模块对于于医疗专有常识举行建模。

值患上一提的是，纵然对于在差别运用的统一模子，内里的参数具备差别的学进修方式，例如可以用MAP、贝叶斯要领直接进修参数漫衍。

对于在深度的神经收集来讲，一旦有了参数漫衍，可以做许多工作，例如可以对于猜测举行不确定性的预计。别的，假如可以或许拿到参数漫衍，纵然数据不足，也能得到很是鲁棒的猜测。同时，模子也会越发强盛，究竟贝叶斯模子等价在无数个模子的采样。

下面给出轻量级的贝叶斯的进修要领，可以用于任何的深度进修的模子或者者任何的深度神经收集上面。

起首明确方针：要领充足高效，可经由过程后向流传举行进修，并“丢弃”采样历程，同时模子可以或许切合直觉。

咱们的要害思绪是：把神经收集的神经元以和参数，当作漫衍，而不是简朴的于高维空间的点或者者是向量。答应神经收集于进修的历程中举行前向流传、后向流传。由于漫衍是用天然参数暗示，该要领定名为NPN（natural-parameter networks）。

#参考文献：

•A survey on Bayesian deep learning. Hao Wang, Dit-Yan Yeung. ACM Computing Surveys (CSUR), 2020.• Towards Bayesian deep learning: a framework and some existing methods. Hao Wang, Dit-Yan Yeung. IEEE Transactions on Knowledge and DataEngineering (TKDE), 2016.

• Collaborative deep learning for reco妹妹ender systems. Hao Wang, Naiyan Wang, Dit-Yan Yeung. Twenty-First ACM SIGKDD Conference on

Knowledge Discovery and Data Mining (KDD), 2015.

• Collaborative recurrent autoencoder: reco妹妹end while learning to fill in the blanks. Hao Wang, Xingjian Shi, Dit-Yan Yeung. Thirtieth Annual

Conference on Neural Information Processing Systems (NIPS), 2016.：

• Natural parameter networks: a class of probabilistic neural networks. Hao Wang, Xingjian Shi, Dit-Yan Yeung. Thirtieth Annual Conference on

Neural Information Processing Systems (NIPS), 2016.

• Relational stacked denoising autoencoder for tag reco妹妹endation. Hao Wang, Xingjian Shi, Dit-Yan Yeung. Twenty-Ninth AAAI Conference onArtificial Intelligence (AAAI), 2015.

• Relational deep learning: A deep latent variable model for link prediction.

Hao Wang, Xingjian Shi, Dit-Yan Yeung. Thirty-First AAAI Conference on Artificial Intelligence (AAAI), 2017.

• Bidirectional inference networks: A class of deep Bayesian networks for health profiling.

Hao Wang, Chengzhi Mao, Hao He, Mingmin Zhao, To妹妹i S. Jaakkola, Dina Katabi. Thirty-Third AAAI Conference on Artificial Intelligence (AAAI),

2019.

• Deep learning for precipitation nowcasting: A benchmark and a new model. Xingjian Shi, Zhihan Gao, Leonard Lausen, Hao Wang, Dit-Yan Yeung,

Wai-kin Wong, and Wang-chun Woo. Thirty-First Annual Conference on Neural Information Processing Systems (NIPS), 2017.

• Convolutional LSTM network: A machine learning approach for precipitation nowcasting. Xingjian Shi, Zhourong Chen, Hao Wang, Dit-Yan Yeung,

Wai-kin Wong, Wang-chun Woo. Twenty-Ninth Annual Conference on Neural Information Processing Systems (NIPS), 2015.

• Continuously indexed domain adaptation. Hao Wang*, Hao He*, Dina Katabi. Thirty-Seventh International Conference on Machine Learning (ICML),

2020.

• Deep graph random process for relational-thinking-based speech recognition. Hengguan Huang, Fuzhao Xue, Hao Wang, Ye Wang. Thirty-

Seventh International Conference on Machine Learning (ICML), 2020.

• STRODE: Stochastic boundary ordinary differential equation. Hengguan Huang, Hongfu Liu, Hao Wang, Chang Xiao, Ye Wang. Thirty-Eighth

International Conference on Machine Learning (ICML), 2021.

• Delving into deep imbalanced regression. Yuzhe Yang, Kaiwen Zha, Yingcong Chen, Hao Wang, Dina Katabi. Thirty-Eighth International Conference

on Machine Learning (ICML), 2021.

• Adversarial attacks are reversible with natural supervision. Chengzhi Mao, Mia Chiquier, Hao Wang, Junfeng Yang, Carl Vondrick. International

Conference on Computer Vision (ICCV), 2021.

• Assessment of medication self-administration using artificial intelligence. Mingmin Zhao*, Kreshnik Hoti*, Hao Wang, Aniruddh, Raghu, Dina

Katabi. Nature Medicine, 2021.

雷峰网(公家号：雷峰网)雷峰网

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

加入收藏

Tag：米兰·(milan)

上一篇：中国人民抗日战争暨世界反法西斯战争胜利80周年专题（四）

下一篇：暂无

返回列表

米兰·(milan)中国官方网站-贝叶斯深度学习：一个统一深度学习和概率图模型的框架

随便看看

产品推荐

哆啦A梦：伴我同行

八月未央

夏洛特烦恼

风再起时

云飞丝路天