米兰·(milan)中国官方网站-ACM 杰出会员姬水旺:量子化学和物理的深度学习

校对于丨维克多
量子技能及人工智能都是当前开始进的科学技能,前者被寄但愿在拥有超强的计较能力,后者已经经于各行各业“年夜杀四方”。当二者相遇会碰撞出甚么样的火花?人工智能又能于哪些方面助气力子技能?
去年12月份,德州农工年夜学计较机科学与工程系(校长有影响力)传授姬水旺于CNCC年夜会上发表了《量子化学及物理的深度进修》的演讲,表达了他对于两个学科的感想。
“量子打破了咱们许多知识性的理解,于量子状况世界的运行其实不确定,咱们至多只能猜测各类成果呈现的几率。”
此外,他还有暗示,量子的研究对于象虽然是原子层级甚至亚原子层级的物体,但与宏不雅法则也有相通的地方,例如可以把份子之间的布局当作一张图,举行处置惩罚。

如下是演讲全文,AI科技评论做了不转变原意的收拾。
各人好,今天我将着重谈谈怎样应用AI以和图形计较技能来解决量子物理和量子化学问题。
起首让咱们来相识一些配景:于经典物理学范畴,咱们会商的是宏不雅世界中的物体或者者征象。好比,你朝一个球踢了一脚,假如你知道球的详细质量、速率以和当前的时间,你就能猜测出五秒后这个球的位置。可是于量子范畴,因为研究对于象是原子层级甚至亚原子层级的物体,例如原子及化学键构成的份子,是以没法根据传统逻辑思索范畴法则。

近些年,咱们不停与各个范畴的专家互助,但愿从量子物理学家、量子化学家、量子质料学家等身上得到研究冲破。这些差别范畴的学者都有一些配合需要研究的话题,而这些话题与图象、AI、特别是深度进修相干联。此刻我来报告请示最新进展。
1AI赶上量子化学
份子由原子和原子间的化学键组成,例如于份子中,原子用点暗示,而份子则由线暗示。以是可以或许将份子以2D图形的情势出现出来。于呆板进修及数据挖掘范畴,图形计较是一个须生常谈的话题。但迁徙到份子范畴,也面对新的挑战:2D图形的情势其实不能彻底挖掘份子的属性。究竟,份子现实上不是一个2D的平面,其具备三维空间属性的。它的布局其实不只由点及线的属性决议,而同时由空间坐标、化学键角等等决议。是以,于摸索份子功效时,需要器重它的三维布局。

怎样高效地使用份子的空间信息去举行猜测和天生模子?动静流传神经收集(Message Passing Neural Network, MPNN)是一种经常使用的图神经收集框架。咱们能发明,此类要领可以归纳为两个方程:聚合函数及节点更新函数。聚合函数能将把邻人节点的信息聚合起来。

当咱们测验考试计较一个节点的信息时,基本上城市思量节点于上个时间点自己的属性以和中介节点的属性,以和界限的信息。计较聚合函数以后,需要使用节点更新函数,这一步要求可以或许使用以前步调的信息与属性,更新此刻的节点信息。但此举只是简朴地思量了节点和界限的特性。以是,咱们近期的事情就是测验考试构建三维图形计较收集,以便可以或许获取完备的三维信息。
一旦需要纳入三维信息,计较收集将变患上很是繁杂,且信息通报也将变患上低效。以是咱们但愿收集于高效的同时,让计较变患上等效与不变。假如有一个份子,当你扭转这个份子时,他的许多2D属性或许不会转变,但3D信息却纷歧定;是以,咱们但愿于猜测和天生模子中,当份子的一个节点扭转时,它的量子属性也连结不变。
模子的猜测功效是指猜测一个给定份子的属性,例如,咱们可以猜测份子是否有作为抗生素的潜力。而天生模子是指按照给定的属性去天生/合成响应的新份子。
当前,已经经有不少研究者将3D属性纳入考量了。此中一个最早的事情叫SchNet,他们将间隔作为三维属性纳入。纵然用SchNet象征着会思量界限以和界限的长度。。近来也有一个事情叫DimeNet。DimeNet于SchNet的基础上更进一步,由于它将角度纳入了考量。例如你有从j到i的信息,你需要计较mi,j,那末需要不单单将节点信息纳入考量,还有需要思量两个化学键之间的角度。

但于化学中,咱们发明仅仅考量间隔及几何外形是远远不敷的。如上图,红色部门代表了一个其实不真实存于的平面,蓝色部门也是云云。份子拥有几何外形,可是仅仅知道三条化学键的间隔、两个键角是无法彻底确定份子的几何外形的。

让咱们思索一下,d1,d2确定的平面与由d2,d3确定的平面之间会存于一个φ角。也恰是这个角,成了上述模子中的不确定因素。由于纵然拥有不异的两个键角时,而φ角不停转变,致使份子的几何外形也会发生转变。
咱们测验考试构建的是一个完备的、可以或许解决所有环境的几何框架,称之为球形信息通报。

为相识决上述问题,将φ角纳入了考量,φ角是X与他的投影之间的夹角。
此举的一个考量是:必需让出现出来的份子是不变稳定的。例如,当扭转份子时,它们的属性,例如所有的夹角,该当不发生变化。。于球形信息通报中,咱们构建一个球坐标系,包括参照点、间隔及扭角。但此模子不是100%完善的。
由于仅仅思量了一个比照,以是当思量其他节点时就会呈现不确定因素。以是咱们的事情是不完善可是很是具备效率的。
近来有一个叫GemNet的体系,他们的设法是,咱们的体系仅仅利用了的A节点的邻人节点的信息,并无利用2-hop范畴信息。GemNet科学家认为,当你利用了2-hop范畴信息时,这个体系将会趋近完美。确凿,当你利用2-hop范畴信息时,角度信息将被较好地归并,而且到达近乎完美的效果,可是问题于在,一旦你利用了2-hop信息,信息更新后将纳入年夜量地邻人节点,整个信息更新步调将变患上异样繁杂。

相较之下,咱们的体系虽然不是100%的完美,但更具效率,可以或许直不雅地看到繁杂水平:n代表节点的数目,K则是所有节点的平均自由度。于现实效果上,咱们的模子与更繁杂的GemNet十分相近。
下图可以或许清楚地展示咱们的模子能或者不克不及暗示哪些环境。a图及b图暗示的是于化学上被称为手性的征象。

事实上,这两个份子就像是镜像。咱们设计的收集可以或许区别这两种环境,而以前许多的要领其实不能做到。由于于咱们的要领中,咱们用到了扭角作为相对于角度,而于手性这个例子中,两者q1的角度别离为60°及90°。可是,于第二种环境下,q1的扭角都为90°,以是咱们的要领没法区别出来。第二种环境也是被社区的偕行们指出“但愿更正”的环境,可是从化学意义上说,这类环境发生的几率很是很是低,由于q2及q3作为差别的原子,他们与q1之间的扭角不异的环境险些不成能发生。以是咱们认为,只管咱们的模子不是100%笼罩了所有的环境,没法笼罩的环境于天然界中很难发生。
2AI碰到量子力学当咱们最先着眼在量子力学时,薛定谔方程为咱们提供相识答思绪。假如你知道间隔角及扭角的数值,你可使用方程中的差别函数,例如球面谐波及球面贝塞尔函数,也能够利用其他的基本函数去网络Θ值,并终极获得一个特性向量。这是一个具备物理意义的特性向量,可以或许于现实的信息通报中利用。

下图是体系构建历程。有输入模块,一个采用旋转角及间隔信息作为输入的交互模块,这个交互模块可能会重估许多次,这个反复的次数将取决在你的数据量。末了是输出模块,有了这个模块,可以或许使信息通报用在一些赛事傍边,例如公然催化剂挑战。

公然催化剂挑战赛是一个由Facebook AI及CMU倡议的竞赛。赛事的宗旨是使用新的年夜范围份子数据去猜测热力学数据。于催化剂发明范畴,这些方针份子凡是都相对于较年夜,每一个份子于布局上平均含有80个原子。

以是他们按照练习与测试的瓜葛将数据集分为四组,打分是按照每个绝对于偏差的平均值,来评价体系可以或许丈量的最好质量。每一一行代表一个模子,CGCNN来自一个使用模子研究份子的公司,还有有SchNet,DimeNet以和GemNet。各人能看到,于所有的体系中,SphereNet可以或许盘踞一个很是有竞争力的职位地方。

上图是来自其他数据集QM9的成果。这是一个相对于较小的数据集,每一一列代表了一个量子属性,每一一行代表了一个猜测要领,从表中可以或许看到每一个要领于差别属性上的平均偏差。

于其他数据集上咱们的体系也是乐成的,例如MD17,这是一个更小的数据集。正如咱们提到的,GemNet由于利用了2-hop数据,计较力需求更年夜,以是只能用于较小的数据集傍边。
正如上图所见,就算于较小的数据集中,咱们体系的体现也稍优在DimeNet,与GemNet比拟体现也相差无几,但GemNet的计较耗损更年夜。
下图计较耗损的比力。截至今朝,与两代的GemNet计较比拟,咱们的计较耗损都是要小患上多的。

下图展示了体系的过滤器。正如所见,每一行代表的份子具备差别的扭角,而于许多环境下咱们的过滤器展示的成果于差别扭角下长短常差别的,这也印证了扭角参数于捕捉差别份子模式时长短常主要的。

简朴小结一下,咱们的设法是测验考试将份子的三维信息完备地展示出来,以是咱们构建了SphereNet 框架。而且框架是理论上近乎完美且很是高效的,从现实效果上来看咱们的框架可能已经经是100%笼罩的了,咱们于这个标的目的上也有了许多的进展。
今朝,相干事情已经经开源,设计成为了“dive into graphs”库。
尤其的,对于在份子研究运用,咱们有一个专门的库叫做“molecule X”。假如你存眷KDD角逐,你会相识咱们是图形神经收集计较范畴的领先者之一,咱们也介入了AI Cures 针对于Covid-19的开放挑战今朝咱们于AUCROC及AUPRC上的成就都是排名第一。
是以咱们的事情重要是开发全新的图象处置惩罚技能,从而解决基础科学范畴特别是量子化学、量子物理、质料科学中的问题。我的团队开发了计较要领、开源了软件库并于集会、期刊中发表了咱们的结果。同时,咱们也介入了多项开放挑战,如KDD杯。
咱们的研究人工智能及量子物理的交织范畴,于量子物理中,因此薛定谔方程为基础的。响应的研究破费很是昂贵,假如构建粒子体系,需要重大的算力撑持才能解决特性值问题。但将量子物理与AI计较联合起来,将是一个很是火热的范畴,今朝,该范畴仍处于摸索阶段。

雷峰网雷峰网(公家号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





