米兰·(milan)中国官方网站-Aquarium华人CEO分享:机器学习在自动驾驶中落地,核心不是模型,是管道
作者:米兰·(milan)文化
更新时间:2026-03-29 15:27:44
点击数:

编纂 | 陈彩娴
当我年夜学卒业后最先第一份事情时,我自认为对于呆板进修相识不少。我曾经于 Pinterest 及可汗学院(Khan Academy)有过两次实习,事情内容是成立呆板进修体系。于伯克利年夜学的末了一年,我睁开了计较机视觉深度进修的研究,并于 Caffe 上事情,这是最早风行的深度进修库之一。卒业后,我插手了一家名为“ Cruise ”的小型创业公司,Cruise专弟子产主动驾驶汽车。此刻我于 Aquarium,帮忙多家公司部署深度进修模子来解决主要的社会问题。这些年来,我成立了相称酷的深度进修及计较机视觉仓库。与我于伯克利做研究的时辰比拟,此刻有更多的人于出产运用步伐中利用深度进修。此刻他们面对的很多问题,与我2016年于 Cruise 所面对的问题是同样的。我有许多于出产中举行深度进修的经验教训想与你们分享,但愿各人可以没必要经由过程艰巨的方式来进修它们。



校准模子的不确定性是一个诱人的研究范畴,模子可以标志它认为可能掉败之处。对于模子举行有用迭代的一个要害部门是集中精神解决最具影响力的问题。要改良一个模子,你需要知道它有甚么问题,而且可以或许按照产物/营业的优先级对于问题举行分类。成立反馈回路的要领有许多,可是起首要发明及分类过错。使用特定范畴的反馈回路。假如有的话,这多是得到模子反馈的很是强盛及有用的要领。例如,猜测使命可以经由过程对于现实发生的汗青数据举行练习来“免费 ”得到标签数据,使他们可以或许不停地输入年夜量的新数据,并相称主动地顺应新环境。设置一个事情流程,让人可以审查你的模子的输出,并于发生过错时举行标志。当人们很轻易经由过程很多模子揣度捕捉过错时,这类要领特别合用。这类环境最多见的发生方式是当客户留意到模子输出中的过错并向呆板进修团队投诉。这是不成低估的,由于这个渠道可让您直接将客户反馈纳入开发周期!一个团队可让人类两重查抄客户可能错过的模子输出:想象一下一个操作职员看着一个呆板人于传送带上对于包举行分类,当他们发明一个过错发生时,就点击一个按钮。设置一个事情流程,让人可以审查你的模子的输出,并于发生过错时举行标志。当人类审查很轻易捕获到年夜量模子推论中的过错时,这就尤其适合。最多见的方式是当客户留意到模子输出中的过错并向ML团队投诉时。这一点不容小觑,由于这个渠道可让你直接将客户的反馈纳入开发周期中 一个团队可让人类细心查抄客户可能错过的模子输出:想一想一个操作职员看着呆板人于传送带上分拣包裹,每一当他们发明有过错发生时就点击一个按钮。当模子运行的频率过高,以至在人们没法举行查抄时,可以思量设置主动复查。当很轻易针对于模子输出编写“健全性查抄”时,这特别有效。例如,每一当激光雷达方针检测器及二维图象方针检测器纷歧致时,或者者帧到帧检测器与时间跟踪体系纷歧致时,标志。当它事情时,它提供了很多有效的反馈,告诉咱们哪里呈现了妨碍环境。当它不起作历时,它只是袒露了你的查抄体系中的过错,或者者遗漏了所有体系堕落的环境,这长短常低危害高回报的。最通用(但坚苦)的解决方案是阐发它所运行的数据的模子不确定性。一个简朴的例子是查看模子于出产中孕育发生低置信度输出的例子。这可以体现出模子确凿不确定之处,但不是100% 切确。有时辰,模子多是自傲地过错的。有时模子是不确定的,由于缺少可用的信息举行优良的推理(例如,人们很难理解的有噪声的输入数据)。有一些模子可以解决这些问题,但这是一个活跃的研究范畴。末了,可以使用模子对于练习集的反馈。例如,查抄模子与其练习/验证数据集(即高丧失的例子)的纷歧致注解高可托度掉败或者标志过错。神经收集嵌入阐发可以提供一种理解练习/验证数据集中妨碍模式模式的要领,而且可以发明练习数据集及出产数据集华夏始数据漫衍的差异。4主动化及委托


雷峰网(公家号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。





