米兰·(milan)中国官方网站-中国首次!清华刘奕群团队获得WSDM 2022唯一最佳论文奖,港中文获得「时间检验奖」
作者:米兰·(milan)文化
更新时间:2026-04-09 10:22:17
点击数:

论文链接:https://arxiv.org/pdf/2110.05789.pdf论文作者为:詹靖涛,毛佳昕,刘奕群,郭嘉丰,张敏,马少平。第一作者为清华年夜学计较机系博士生詹靖涛,通信作者为清华年夜学计较机系刘奕群传授,相干结果由清华年夜学、中国人平易近年夜学、中科院计较所等单元配合完成。
图注:刘奕群传授跟着深度进修及预练习语言模子等的广泛运用,浓厚向量检索已经经成为互联网搜刮历程中最主要及频仍的数据操作之一,但已经有的浓厚向量检索模子与传统索引检索模子比拟年夜幅增长了存储开消与时间繁杂度,造成为了机能晋升的主要瓶颈。针对于上述问题,这篇论文提出了一种经由过程有约束聚类(Constrained Clustering)改良浓厚向量检索历程的检索模子RepCONC。
图注:论文提出的检索模子练习流程图该模子基在有约束聚类要领端到端地结合优化文本编码器及向量量化历程,RepCONC约束浓厚向量被匀称地分配到差别的量化中央,从而年夜幅晋升了浓厚向量暗示的可鉴别性,改善了检索机能。论文从理论上证实了该约束的主要性,并利用最优传输理论推导了有约束聚类历程的类似解以晋升算法效率。RepCONC可以于业界通用的向量倒排文件体系(IVF)上运行,纵然离开GPU仅利用CPU也能取患上较好的索引压缩与检索效果,比传统浓厚向量检索要领于压缩比、检索机能、时间效率等方面均有显著晋升。
图注:约束聚类历程的示用意除了了每一年选出的独一最好论文,年夜会还有别离选出了3篇最好论文提名(Best Paper Award Runner-Ups):Doubly Robust Off-Policy Evaluation for Ranking Policies under the Cascade Behavior Model(东京工业年夜学)Evaluating Mixed-initiative Conversational Search Systems via User Simulation(提契诺年夜学)The Datasets Dile妹妹a: How Much Do We Really Know About Reco妹妹endation Datasets?(南洋理工年夜学)2时间查验奖得到WSDM 2022「时间查验奖」的事情是来自中国香港中文年夜学的“Reco妹妹ender Systems with Social Regularization”。年夜会给出的颁奖理由是:保举体系已经成为学术界与工业界耐久不衰的研究课题。委员会选中这篇论文,是由于它的主要性及对于范畴的影响力。该论文深切切磋了信托及保举之间的瓜葛,熟悉到用户纷歧定与他们信托的人有相似的咀嚼,但同时又必定了信托对于保举的主要性。论文作者经由过程为多个差别的保举使命成立最适合的社交接洽,从而帮忙确立了将社交旌旗灯号纳入保举体系的价值。是以,这篇论文不单孕育发生了强盛的影响力(于WSDM 时间查验奖的所有提名中被援用次数至多),还有提早预感了信托及透明度于保举体系中的主要性,于近日已经成为一个主要的话题。该论文于2011年WSDM 2011吸收。
论文地址:https://dennyzhou.github.io/papers/RSR.pdf于这篇事情中,中国香港中文年夜学计较机系的研究团队创始性地研究了其时少人问津、现下火热的「社交保举」问题。今朝,社交保举已经成为各个互联网产物的必备技术,微博、抖音、淘宝、微信「看一看」等等都有该功效。他们基在用户的社交挚友信息(从豆瓣等平台挖掘数据),提出了两种社交保举算法,采用社交正则化项约束矩阵分化方针函数,来帮忙提高保举体系的猜测正确性。试验成果注解,他们的要领很是通用,合用在解决多种类型的信托感知保举问题。不仅云云,该论文还有会反向思索,意想到:社交瓜葛的存于可能会降低保举质量。从单一信托出发亦可能孕育发生正确率较低的保举,好比擅长研究球鞋的伴侣纷歧定擅长影戏保举。是以,作者们又很早就用相似度函数,设计了基在差别保举使命来辨认方针伴侣群的算法,以对于社交体系举行更真正的建模。于论文中,他们提出:他们信赖,跟着于线社交网站的快速成长,基在社交的研究会愈来愈风行。事实证实,确凿云云。参考链接:1.https://www.wsdm-conference.org/2022/2.https://mp.weixin.qq.com/s/FLtWupAxoqAthXYQOa3YrQ?v_p=89 WBAPIAnalysisOriUICodes=10000001 launchid=10000365--x wm=3333_2001 aid=01A3NNUgUONWBBii_bsE-e7BIuQxBjrg6ihZ9c4RkfEruJoPI. from=10C2093010
雷峰网(公家号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。





