米兰·(milan)中国官方网站-青年科学家韩晓光:没有被 SIGGRAPH 虐过的人生,不足以谈元宇宙
一、弘远视线
2005 年,韩晓光上年夜学的那一年,中国的图形学汗青刚履历了一个高光时刻:
那一年,以沈向洋、郭百宁等报酬首的微软亚洲研究院(MSRA)研究团队于世界图形学顶级集会 SIGGRAPH 上发表 9 篇论文,占昔时 SIGGRAPH 全世界论文吸收总量(98篇)的十分之一。
这也组成了一代微软人的影象与自豪。
韩晓光不是微软人,厥后也不曾于微软实习或者事情过,但当他于 2009 年到浙江年夜学读研究生时,集中于浙年夜的上一代微软人对于 SIGGRAPH 的崇敬与寻求还有是深深地传染了他:
他记患上,其时刚开学没多久,导师刘利刚就跟他们一众新生说:“咱们的方针就是发 SIGGRAPH,由于 SIGGRAPH 是图形学范畴的顶会。”
刘利刚是浙年夜本身造就的图形学博士,博士卒业后就去了 MSRA,于 MSRA 呆了三年(2002-2004),引导教员是童欣及沈向洋。MSRA 的研究气氛与事情履历,让刘利刚知道:于 SIGGRAPH 上发文是一件很主要、并且很庆幸的工作。
以是,韩晓光很早就知道 SIGGRAPH 的存于,也逐渐树立了与刘利刚同样的认知。
事实上,纵然是此刻,中国的很多高校也未将 SIGGRAPH 作为引导图形学研究的方针,由于 SIGGRAPH 的中稿难度其实是过高了:每一年 SIGGRAPH 的全世界论文吸收总量不外百来篇,中国所有研究者加起来的中稿数目也不外数十篇。
但韩晓光从硕士最先就树立了如许一个方针:研究图形学就是要发 SIGGRAPH。
其时韩晓光地点的浙年夜,周围的圈子里,除了了刘利刚,还有有很多从 MSRA 回来的人,好比周昆、任重,他们如今都是图形学范畴的知论理学者。
认识图形学的人都知道,浙年夜与 MSRA 是中国图形学研究最出名的两个机构,而二者初期于图形学的人材造就与彼此运送上又有着深挚渊源。

图注:MSRA 初期,沈向洋与郭百宁等人交流
李开复于 1998 年回国创建微软中国研究院(也就是厥后的 MSRA),浙年夜本硕卒业生、1999 年从清华博士卒业的童欣(如今人称“童姥”)就插手此中,与沈向洋、郭百宁、刘文印、徐迎庆等人是最早一批计较机图象研究者,方针就是发 SIGGRAPH。童欣以后,浙年夜卒业的很多图形学硕博生也前后去了微软亚研,如刘利刚、周昆、任重等等。
他们这批人于 MSRA 时都感触感染过“四万人年夜会” SIGGRAPH 的魅力,知道本身的事情假如可以或许发于如许一个权势巨子的国际顶会上是何等了不得的事。响应地,由沈向洋如许有 SIGGRAPH 发文经验的内行领导,他们也都进修到很多冲刺 SIGGRAPH 的技巧。
2010 年先后,图形学的研究比重于 MSRA 逐渐降落,很多人陆陆续续脱离,又回到了浙年夜。除了了周昆、任重这些浙年夜走出来的学子,还有有侯启明等清北卒业生。年轻的血液回流,浙年夜的图形学研究也更上一层楼,每一年于 SIGGRAPH 上发不少文章。
韩晓光于浙年夜读的是数学系,两年制。这两年里,他的一个感触感染是:身旁有很多熟悉的人陆陆续续都发了 SIGGRAPH,似乎“中一篇 SIGGRAPH 是一件很轻易的工作”。
那时韩晓光没有发论文的科研压力,但于浙年夜的这个小圈子里,受导师刘利刚与周围人的影响,他对于图形学的科研兴致与 SIGGRAPH 的神驰最先形成。
刘利刚于科研之余也会跟他们讲一些于 MSRA 做科研的趣事,好比偶遇沈向洋的难度:
那时,沈向洋老是忙科研忙患上不见人影。谁要能于电梯里“逮”到他,就要于出电梯前的短短一两分钟内将本身的研究先容给他。这很是磨练各人的表达能力,长此以往,各人就把这件事戏称为“电梯效应”。
这件事也给韩晓光留下了深刻的印象,使他天然而然地感觉:一个真正优异的科学家,应该是求知若渴,用尽一样平常的每一分每一秒去研究与思索的。
其实不是每一个人于刚进入一个范畴时就有时机知道这个范畴最牛的一群人都于研究甚么、怎么研究,以和本身往后要往哪一个标的目的努力,才能成为该范畴的佼佼者。而归功在刘利刚的引领,韩晓光于 22 岁的时辰就已经经以 SIGGRAPH 为方针。
这直接塑造了他的思索方式。以是,从浙年夜最先,韩晓光就喜欢浏览图形学方面的研究论文,特别是 SIGGRAPH 如许的顶会论文。
现任中国香港中文年夜学(深圳)理工学院助理传授、第十一届吴文俊人工智能优异青年奖得到者韩晓光的图形学之旅,就是如许最先的。

图注:学生时代的韩晓光
二、虔敬、进步
刚接触图形学时,韩晓光还有是一个心中有梦、眼里有光的少年,十分自傲、自得。
那时,他其实不知道图形学的难度,视 SIGGRAPH 为囊中之物,给本身定了一个方针:每一年都发一篇 SIGGRAPH。
但很快,这个“傲慢”的设法就被教诲了。
韩晓光真正最先投 SIGGRAPH,是 2011 年到中国香港都会年夜学担当研究助理以后。
于浙年夜那会,韩晓光介入过一个事情,是用图形学对于人体的身高体重举行全局一致的整形重塑,终极文章发表于图形学顶刊 ACM Transactions on Graphics(TOG)上。

论文:Parametric Reshaping of Human Bodies in Images
这个事情是浙年夜与中国香港都会年夜学互助的一个项目。韩晓光由此熟悉了于中国香港城年夜任教的傅红波传授。
邻近硕士卒业时,因为英语成就欠安,直接申请读博有难度,以是韩晓光就接洽了傅红波,但愿先去他的组里当研究助理,然后找读博的时机。
当研究助理的第一年,韩晓光就最先规划投 SIGGRAPH。但没想到,规划是规划,实际是实际,韩晓光追赶 SIGGRAPH 的历程远远比他想患上还有要煎熬。
第一年,傅红波给了他一个课题。他斗志满满,一拿到标题问题,他想的就是奔着 SIGGRAPH 去。研究进展地很顺遂,也取患了一些不错的试验成果,在是他就抱着“应该能中”的表情投了出去。
成果出来,虽然整体评分还有不错,但此中一个审稿人给出了“拒稿”定见。以后,他接连改了好频频投出去,末了才中了一个排名不算尤其好的期刊。
韩晓光第一次感触感染到:似乎 SIGGRAPH 还有挺难的。
第二年,他又做了一个新的项目,但试验成果还有没有第一年好,连本身的尺度都达不到。末了,他爽性连 SIGGRAPH 也没有投。
这让他有点泄气。为了投 SIGGRAPH,他持续几个月都吃睡于试验室,常常熬夜、看论文、赶论文,而成果却不如意。
其时他有傲气,心里总想:“我必然要中一篇 SIGGRAPH。险些成为了一种执念。”
韩晓光过后告诉雷峰网,从小到年夜,他都是一个比力佛系的人,知道念书的主要性就会去努力念书,但成就怎样,往往是尽人事、听天命。他独一对峙过的工作,就是发表 SIGGRAPH。
并且,这类执著一直贯串到 2013 年他去中国香港年夜学读博的四年。
到港年夜读博后,韩晓光继承死磕图形学、死磕 SIGGRAPH。
他的导师是其时方才从美国 UIUC 竣事教职回港任教的俞益洲。
俞益洲也是浙年夜造就的图形学卒业生,曾经师从中国第一个于 SIGGRAPH (1988年)上发表论文的图形学前驱彭群生,厥后因于几何建模及基在图象的建模方面孝敬凸起被选了 2019 年度的 IEEE Fellow。
博士第一年,俞益洲就给了韩晓光一个很有难度的课题——人体三维重修。
只管其时的设法只是做简朴的重修,基在极少量图象,联合交互技能天生一个三维人体模子,但于阿谁时辰,相干技能还有远远没有成熟。以是只管俞益洲的研究目光很前瞻,但对于其时的韩晓光来讲难度却着实不小。
韩晓光花了一年多时间去摸索,末了发明课题还有是太难,没有取患上好的试验成果,投 SIGGRAPH 没乐成,又转去投 CVPR。这是韩晓光第一次投 CVPR,本性乐不雅的他再一次想“应该能中”,成果跟第一次投 SIGGRAPH 同样,也受到了“拒稿”。
那时辰,他最先真正地从心底里对于 SIGGRAPH、CVPR 如许的顶会孕育发生畏敬之心,知道本来要发一篇 SIGGRAPH 不是那末简朴的,“要做一个很顶级的事情,真的要花尤其多努力才行”,并且“必需做患上很是完善”。
博士第二年与第三年,韩晓光换了研究课题,但本身的课题还有是没有中 SIGGRAPH,却是他介入的试验室其他成员的事情前后发表于了 SIGGRAPH 2015 及 2016 上,一篇第二作者,一篇配合一作。但韩晓光感觉不克不及算是本身的代表作。
一直到 2017 年,也就是韩晓光读博的末了一年,他才于 SIGGRAPGH 发表了一篇一作论文、也是他博士生活生计最主要的一个事情:DeepSketch2Face。
2015 年,肖建雄、汤晓鸥等人互助将深度进修用在三维视觉研究,“3D ShapeNets: A Deep Representation for Volumetric Shapes”一文于 CVPR 引起广泛存眷,也吸引了一直想做三维重修的俞益洲。他立即向团队提出要最先研究深度进修。
他将人脸三维重修的课题派给韩晓光,但愿他能基在深度进修对于人脸举行三维草图重修。韩晓光从 2016 年最先独自摸索,花了快要一年的时间,联合深度进修、视觉图象理解、图形学中的人脸建模、几何变形与交互等多个学科的常识,居然乐成地取患了不错的成果。

论文:DeepSketch2Face: A Deep Learning Based Sketching System for 3D Face and Caricature Modeling
利用 DeepSketch2Face 这个体系,用户可以于几分钟内就得到心情各别的 3D 人脸或者漫画模子,游戏或者动画建模师们也能够轻松创立高保真人脸模子,进而为虚拟脚色付与灵动形象。这个事情发表于 SIGGRAPH 2017,遭到很多人的必定。韩晓光第一次被约请到了各个场所做演讲分享。
用时多年、乐成发表 SIGGRAPH 一作,韩晓光的心田有高兴、有自豪,但更多的,是一种已经经被考验过的虔敬与谦卑。
于这几年里,SIGGRAPH 就像图形学的一座圣碑,引导韩晓光进步,也教会了他科研的素质:历经挫折仍要不改初心,遭受低谷也要昂首向前。但最主要的,是这历程中攀缘所看到的风光。
这是没有元宇宙时的图形学发展人生。
三、从跟随者到设置装备摆设者
于韩晓光读研究生、到他插手港中深的多年里,图形学的就业标的目的实在一直狭小,集中于寻求酷炫殊效的影视与游戏行业。加之海内科幻影戏成长不振,游戏行业政策也不开阔爽朗,以是图形学于海内一直是一个“小圈子”。
2018 年韩晓光到港中深任职时,整个黉舍就只有他这一个研究图形学的教员。
此刻港中深一共有两位研究内容与图形学相干的教员,一名是韩晓光,另外一位则是 2021 年新插手的孙启霖。不外,孙启霖的事情也不是传统的图形学,而是图形学顶用在三维图象收罗的计较成像装备。
这时期,韩晓光也见证或者亲历了图形学的成长变化:
一方面是元宇宙观点的鼓起,给图形学带来了新的想象力,涌入图形学范畴的科研资金也于增多,圈子于扩展。
韩晓光记患上,其时他刚最先从事教职时,由于圈子小,招生与找钱都是一件很坚苦的工作。厥后,也是多亏他之前的导师刘利刚(厥后去了中科年夜任教)与时任港中深校长讲座传授的崔曙光先容,才解决了招生及科研经费的难题。
元宇宙年夜火后,图形学技能最先遭到很多企业的存眷。于去年,就有几家海内的企业找到了韩晓光,但愿与他互助。
韩晓光于 SIGGRAPH 2017 上发表的事情 DeepSketch2Face 属在深度进修于计较机图形学中的一次斗胆测验考试。于这个标的目的上,他也是入门最早的青年学者之一。今朝,他于港中深成立的试验室 GAP,就将三维视觉作为试验室一个重点研究的标的目的。
“GAP”的全称是“Generation and Analysis of Pixels, Points and Polygons”,此中,pixels 指的是“像素”,points 是“点云”,polygons是“多边形网格”,这三块是图形学及视觉范畴需要重点处置惩罚的对于象,而天生与阐发/理解是两年夜使命。如许加起来,就组成了“GAP”一位。
GAP Lab 主页:https://gaplab.cuhk.edu.cn/
三维视觉一块也触及到计较机视觉的常识,韩晓光于任教后也不停进修这一块的内容,并将其与图形学相联合,也取患了不错的成就。例如,他于单视角三维重修方面的研究就曾经两次入围 CVPR 的最好论文提名。
单视角三维重修是从年夜量的二维图象中恢复物体(如人体、人脸、场景等)的三维布局,于计较机上实现对于客不雅世界的虚拟实际表达。
为相识决从单视角图象中重修完备三维物体的视觉难题,韩晓光与童欣等人曾经互助设计了一种基在骨架表达的新型三维几何深度进修算法,可以或许美丽地实现对于拓扑繁杂的物体外形重修。

这项结果(“A Skeleton-bridged Deep Learning Approach for Generating Meshes of Complex Topologies from Single RGB Images”)令集会审稿人面前一亮,均给出了“Strong Accept”(强烈吸收)的定见,入围了 CVPR 2019 最好论文提名。
除了了繁杂外形的物体,更年夜空间的场景重修也是一个主要使命。韩晓光提出的从单张图象完备重修室内场景的要领,联合场景理解及三维网格重修两种使命,可以或许主动天生房间结构、摄像机姿态、物体包抄盒及三维网格,并彻底恢复室内物体的几何信息。

这篇论文(“Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image”)也一样获得了审稿人的一致好评,入围了 CVPR 2020 最好论文提名。
近两年,韩晓光最自豪的一项事情是与团队发表了一个包罗 2078 个高清楚度三维服装点云模子的数据集 Deep Fashion 3D,是全世界今朝最年夜的真实三维服装数据集,得到了中国计较机图形学年夜会(Chinagraph)2020 年度的“图形开源数据集奖”。
本年,他们又有一项服装三维重修的事情(Registering Explicit to Implicit: Towards High-Fidelity Garment mesh Reconstruction from Single Images)发表于了 CVPR 2022。
对于服装举行三维重修的难点于在衣服的褶皱细节,韩晓光提出的新型单幅图象三维服装重修要领,将显式网格与隐式外形的暗示要领相联合,可以或许很好地重修出差别的服装类型以和富厚的几何细节,看起来也更传神:

近两年,很多研究事情也注解,图形学与视觉的彼此借鉴可以或许带来很多新的设法。
韩晓光从 2016 年研究 DeepSketch2Face 时最先接触深度进修与计较机视觉,逐渐对于两个范畴的共性与差异有更深的相识。他于基在深度进修的三维重修一块的事情,也表现了将二者交融的思索,是海内甚至全世界较早研究这一标的目的的学者之一。
这时候候的韩晓光,现实上已经从图形学的跟随者,变为图形学的设置装备摆设者。但比拟起当初的任意轻狂,如今的韩晓光却更谦卑、努力。他的学生常有如许的感触感染:前一天晚上他们才会商事情到凌晨一点,第二天早上七点钟就又接到了他的动静。

关在怎样当一位学者,韩晓光也是遭到图形学先辈的影响:
2018 年那会,他刚当年夜学教员,到深圳年夜学到场一个图形学的集会。那时童欣也是参会者之一,他们坐统一辆年夜巴,韩晓光就座于童欣阁下。
他问童欣:“童姥,您研究图形学几十年,为何还有这么当真地听陈诉呢?”
但童欣回覆他:“实在我还有有许多常识不懂,还有要跟于座的讲者多进修。”
童欣的谦卑与勤学,给韩晓光的心中留下了很深的印象。他过后告诉雷峰网:“像童姥如许研究图形学研究了几十年的学者都这么谦善,都还有于不停进修,我才刚入门没几年,有甚么理由懈怠呢?”
四、元宇宙的热与冷
韩晓光对于图形学的畏敬与虔敬,也延续到了他对于元宇宙热潮的思索上。
这两年,险些所有计较机的从业者都于存眷元宇宙,Facebook 更是直接更名为 Meta。很多原本将 AI 作为招牌的企业,也纷纷往元宇宙上靠边,与之相干的图形学技能也遭到了极年夜的追捧。
此前韩晓光一直于学术圈勾当,但最近几年来,他也感触感染到了工业界对于元宇宙、甚至图形学的存眷。
今朝,韩晓光的 GAP 团队也于与企业界互助,研究怎样用图形学、视觉等常识来做虚拟人或者虚拟场景。
元宇宙的一个基础理念,就是要将实际的物理世界数字化,将人、物体、场景等等于虚拟世界中尽可能真实地还有原,当下正火的虚拟人与虚拟场景恰是构建元宇宙不成缺乏的部门。
素质上来讲,图形学技能就是“造假”,能辅助天生虚拟世界中的内容,如前面韩晓光用图形学天生数字化的场景(房间、桌子、椅子),并且真实度更高。
这一点于游戏中可以作证:早年咱们玩的马里奥游戏画面是像素格子,引入图形学的技能后,此刻的游戏画面可以做到十分流利、传神。
但同时,韩晓光于会商元宇宙时,也时刻连结着一种沉着的立场:元宇宙是一个观点,它的热度也许过两年就会减退,但图形学的研究倒是一个要连续举行的事情,由于这项技能的研究门坎很高,理论冲破也很难。
这不仅是韩晓光从早年追赶 SIGGRAPH 的履历中所感悟到的,也是他对于图形学技能有清楚思索的结论。

图注:现任港中深助理传授的韩晓光
图形学确凿可以帮忙组织元宇宙,但当前的技能还有未成长成熟,间隔所有人都能于虚拟的数字世界中利用图形学东西来创作内容的临界点还有有很长的路要走,多是五年,也多是十年。
好比,韩晓光与团队就常会商元宇宙中的交互问题。
初期的图形学也是解决用户与计较机的交互:例如,人类用户操作鼠标,从左到右于物理空间中同等根线,计较机要怎样基在这一简朴操作来理解人类想要“画一根线”的用意,就是图形学要解决的问题。
而于元宇宙中,图形学要解决的问题比用户简朴地画一条线更繁杂,当前的图形学技能还有没法让年夜大都人只用很短的时间就能于数字世界中操作。可以假想一下:如果你要于游戏《塞尔达传说》的年夜草原中建一栋屋子,难度有多年夜?
除了了算法的切确度与“可骇谷效应”外,研发成本也是要思量的问题。就拿虚拟人来讲,当前各个公司打造虚拟人都需要人类建模师予以辅助,造价昂扬。
以是,于元宇宙的海潮中,韩晓光看到了时机,也看到了挑战。
他告诉雷峰网,站于他的角度,他天然但愿可以或许用图形学、计较机视觉等常识来降低虚拟人、虚拟场景的研发成本,改良算法精度等等,但这需要时间。
本钱的耐烦往往是有限期的。不外对于韩晓光来讲,他本就是从图形学少人问津的时辰走到车水马龙,纵然元宇宙明天就减退,他也还有是会苦守于原本的位置上,做他本该做的工作,就是踏结壮实地做科研而已。
五、对于话韩晓光
雷峰网(公家号:雷峰网):怎么用图形学打造元宇宙?
韩晓光:我只能从技能的角度讲讲。以虚拟报酬例,图形学打造虚拟人重要有几步:
第一步是收罗。
咱们用手机拍一张照片,就是对于周围的世界做了一次二维数字化。虚拟人的构建则需要“三维数字化”。收罗对于象是真人,就需要对于整小我私家体包括皮肤、衣服、头发、鞋子等等举行收罗。头发的发质与密度有参差,衣服的款式与材质也多种多样,这对于收罗图象的细粒度要求很是高。
以是,要想 1:1 还有原,光用手机拍一张照片还有不敷,还有需要利用多台装备做多视角的收罗。使用专业的立体相机与摄像装备如 RGBD、Light Stage 等,就能够全方位捕获人体三维模子信息。
第二步是建模。
收罗完人的数据后,就是举行建模。虚拟人建模的难点是怎样于计较机中找到一种适合的表达方式来表达真人的特性细粒度,如上述谈到的皮肤、衣服、头发、睫毛等等。举个例子,怎样表达头发?就是用一根一根的线去表达,多是 10 万根线,这 10 万根线由算法主动天生。
表达也分两部门,一部门是三维几何,即物体的外形;另外一部门是纹理及材质。建模这一步,就是要建几何、纹理与材质。
第三步是衬着。
建模以后,就是衬着。衬着就是将一个物体于光的情况下出现出的样子容貌举行表达。
比喻说,获得一个球体的三维表达后,球的颜色是黄色,材质是皮质,衬着可以将球衬着成差别的样子,可能将球衬着成玻璃材质,也可能衬着成木头材质,一打光、材质掉真。而要将球真实还有原,就要还有原到其自己的皮质。
第四步是动画。
以上三个步调完成,获得的是静态的人体模子,怎样让虚拟人做起动作来也灵动传神,就是以后的动画所要思量的工作。不管是人挪动时衣服纹路的细腻变化,还有是流水、气体、云雾、燃烧等动态的天然征象,都需要做有高度物理真实感的模仿,来加强咱们于元宇宙中的沉浸感。
雷峰网:今朝海内许多企业都有团队于研究虚拟人,就是用图形学技能做的吗?
韩晓光:年夜概都是这几步。不外,今朝的虚拟人技能还有都不是纯靠图形学,暗地里年夜多有人类建模师的介入。最多见的流程是:
用算法做出一个粗模,然后交给建模师,建模师对于粗模举行润色、改良,获得一个高模,高模出来后还有需要建模师去界说虚拟人怎样动、界说人体的要害点来形成骨架,然后再经由过程一些视频算法获守信息,让虚拟人动起来,再把这段动起来的视频交给工程师精修,末了才出来一段各人看起来还有不错的虚拟人视频。
假如只是做静态的虚拟人,几千上万块就能弄定。但若你但愿这个形象可以或许像真人同样动起来,动的时间越长,价格就越高。以是从我的角度看,我是但愿能从技能的改良中降低一些成本。
雷峰网:2018 年您刚找教职时,元宇宙还有没呈现,图形学的存眷度也不是很高,您其时怎么招生、申请科研基金?
韩晓光:其时确凿是比力难。图形学是一个小圈子,虽然你的竞争者未几,可是能申请到的科研经费也未几。我最最先是跟其他教员互助引导学生,然后我的硕士导师刘利刚(此刻于中科年夜)也给我先容了一些学生。
别的,于我初入教职时,崔曙光教员对于我的撑持很是年夜。我之前听刘利刚教员说过,人的平生必然会碰到几个朱紫,我感觉崔教员就是我职业生活生计中的第一名朱紫。
我记患上最早找教职的时辰,就是崔教员口试我,以是我熟悉的第一名港中深的教员就是崔教员。2018 年我入职时,崔教员还有没有全职插手港中深,于美国还有有职位,以是他管的工作不是许多。但那时辰,我有甚么工作,找崔教员,他都长短常撑持。许多时辰我就给他发一个信息,问他能不克不及怎么怎么样,崔教员就是回两个字:撑持。
这让我觉得到很是惬意,于项目经费、带学生方面,崔教员也长短常撑持。崔教员本身是研究收集通讯的,对于在我的研究标的目的不是尤其相识,但他就长短常撑持我,也给了我很年夜的自由度。日常平凡他也会跟咱们讲讲学术界要留意甚么,也会有一些教育。
崔曙光教员曾经担当港中深理工学院履行院长,今朝担当港中深将来智联收集研究院的开创院长,我也于这个研究院下面,随着他一路干事情。

图注:韩晓光(右四)、崔曙光(左四)与试验室学生的合影
雷峰网:将来智联收集研究院是甚么个环境?
韩晓光:研究院是于去年景立的,今朝正于负担国度重点研发规划,广东省重点研发规划,广东省珠江团队项目,建立了港中年夜(深圳)-国度无委会监测中央检测中央频谱年夜数据结合试验室、港中年夜(深圳)-京东集团人工智能结合试验室、港中年夜(深圳)-罗湖病院集团医疗年夜数据结合试验室、深圳市年夜数据与人工智能重点试验室等。雷峰网
研究院的久远方针是成长数据驱动的将来信息收集、类脑智能、人机接口、漫衍式网联智能、聪明病院运用等标的目的的科学研究。
雷峰网:您方才谈到童姥的学者风范,咱们留意到童姥 9 月 2 号到场了你们第四期 PaSS 的访谈。上一期,你们也约请了旷视的张祥雨。为何要做 PaSS 这个节目?
韩晓光:咱们试验室方才起步时,许多学生都是小白,以是于做科研受挫时,他们常常会想:假如没有措施很快产出论文,是否是就不合适这个标的目的?常常自我思疑。
由于我也履历过发 SIGGRAPH 的疾苦,以是我也能理解。我一最先会跟他们说,只要标的目的是对于的,加之各人有自动摸索的意愿,风雨以后总有彩虹。但我发明,只是说原理,各人很难接管。以是我就想,是否是能用学者们切身履历过的故事来让他们知道,摸索中的盘曲是一件很正常的工作。
我就想到办 PaSS(Paper Story Sharing)故事会,约请一些图形学及视觉范畴的先辈来给各人讲讲论文暗地里的故事:他们最最先是怎么孕育发生一个设法的,于设法实行的历程中碰到了哪些问题,面临这些问题的时辰是如何的心态,这些问题末了是如何的环境?这些谜底可让学生更相识一个事情及科研。
我本意也只是想约请一些先辈给组里的学生分享故事,但厥后感觉但愿能对于更多的图形学及视觉社区的人有所帮忙,便将PaSS办成为了直播的情势。这可能也是遭到我教员刘利刚的影响,他就很喜欢给社区做孝敬,GAMES(海内知名的图形学论坛)就是他倡议开办的。
雷峰网:您同时活跃于图形学及视觉两个社区,对于这两个范畴的共性及差异性有甚么领会?
韩晓光:从研究内容上来讲,一个简朴的区分多是,图形学是天生,视觉是理解。不外我感觉没有须要将两个标的目的分患上那末开,好比我研究的三维重修就是两个范畴都体贴的问题。
前几年我还有是投 CVPR 多一点。SIGGRAPH 也有投,但很少中,由于有三四年没怎么专注于图形学这一块,研究做的不敷多。据本年的统计,年夜陆高校一共也才中了 46 篇 SIGGRAPH。
我的一个感触感染是,视觉社区及图形学社区的科研咀嚼还有是不太同样的。许多图形学的研究向 CVPR 投稿不会被吸收,许多视觉的研究投 SIGGRAPH 也会被直接拒稿。
以人脸辨认为例,假如你于人脸辨认上的研究成果做不到能用,那末你投 SIGGRAPH 基本上是中不了的。但视觉纷歧样,视觉喜欢界说一个问题,然后各人针对于这个问题做研究,把机能晋升患上越高就好。两个范畴的弄法纷歧样。这几年我从图形学转到视觉的历程中对于这一点就深有领会。
雷峰网:可否举一个详细的例子?
韩晓光:好比咱们做过一项人体姿态预计的研究,咱们写的论文投向 CV 三年夜顶会,先后两年投了四次才中。雷峰网
于人体姿态预计问题上,图形学的做法是专注在解决一个详细问题,做到效果很好,好比只做一小我私家的姿态预计或者者两小我私家跳华尔兹舞的姿态预计,可以用到许多先验常识来帮忙你做患上更好。
根据如许的途径做完这项事情以后我就投稿,获得的审稿定见确凿很好,效果也挺好的,可是他们说不敷 general(通用)。这是我第一次觉得到图形学跟视觉于研究上面是有区分的。图形学是为了做出效果,以是做的工具可以很 narrow,但精度很高。而视觉要求 general,也就是往往更喜欢做很是泛的算法。
以是咱们就去改,改出来的第二版还有是没有做患上很 general,厥后投稿成果还有是同样,审稿定见指出了一样的问题。末了到了第三次修改的时辰,咱们就让步了,去“怼”算法,做了一个 general(通用)的工具。
这是两个范畴差别的 taste。我感觉审稿人说的是有原理的,只是两个范畴不太同样罢了。这几年我逐步从图形转到视觉,有过许多试错,逐步就有觉得了。
雷峰网:您会更认同哪种“弄法”?
韩晓光:我倒感觉无所谓。做研究跟投甚么顶会没有多年夜的瓜葛,焦点是研究,把事情做好,把现有的问题解决失,末了投哪一个集会均可以。我此刻已经颠末了非要中 SIGGRAPH 的阿谁阶段了(笑)。
实在每一个人读博前的成就都很是好。读博以后,碰到各类各样的挫折,我感觉是很正常的。我常常跟学生说,科研必然是一个不停自我思疑的历程,这内里最主要的是要自我说服,本身给本身打鸡血,自我慰藉、自我承认。好比我也是花了七年的时间才完成一个只属在本身的还有不错的事情。
此刻元宇宙很火,试验室里也有一些学生但愿之后去打造元宇宙,我感觉这均可以。胡想还有是要有的,但要对峙,说不定哪天就能实现了。但咱们做研究,也不但单是为了发论文或者随年夜流,终极还有是为了能对于科技做点菲薄单薄的孝敬,真正能鞭策范畴的成长。雷峰网
(港中深于读博士生邱宇达对于本文亦有孝敬)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





