米兰·(milan)中国官方网站-参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

作者 | 陈彩娴
编纂 | 岑峰不久前,Meta AI 传播鼓吹,其在去年3月提出的10亿参数自监视模子 SEER (SElf-supERvised)又取患了新冲破:新的 SEER 参数目翻了10倍,到达了100亿参数,可以取患上更优异、更公允的机能体现!
如下咱们暂且称新的 SEER 模子为“SEER 10B”(一个牛逼不足以形容 Meta AI 于步履上落实自监视的野心,手动狗头)。
按照 Meta AI 的团队先容,他们将 SEER 10B 模子于50+个基准与多个差别未标志数据集长进行了测试。此中,SEER 10B 不仅于 ImageNet 上取患了高达 85.8% 的正确率(排名第一),与原先只有 10 亿参数目的 SEER (84.2%)比拟机能晋升了 1.6%。
此外,SEER 10B 于性别、肤色、春秋等三个公允基准上得到了更精彩的辨认效果,较着优在监视模子。

论文地址:https://arxiv.org/pdf/2202.08360.pdf
注意 Meta AI 的伴侣不难发明:近来,Meta AI 首席科学家 Yann LeCun 与 Meta 开创人扎克伯格于公然讲话中对峙夸大自监视进修的优胜性。上周,LeCun还有提到自监视与世界模子,将 AI 终极能学会像人类同样进修与推理的但愿寄托于这两个要领上。
所谓“自监视进修”,就是 AI 体系可以直接从文本、图象或者其他类型的无标志数据中直接进修,重要针对于解决监视进修所需的海量标志数据问题,由于于实际研究中,要获取年夜量的标志数据难度极高。

LeCun一直认为,自监视进修是构建具备配景常识或者“知识”的呆板、以解决远远凌驾现今 AI 使命的最有远景的要领之一。
但同时,也有读者评价 Meta 提倡的自监视素质上不外是强化进修。不久前,“怼王”Jürgen Schmidhuber 也发表文章,称“All You Need Is Supervised Learning”,重申监视进修于冲破 AI 瓶颈中饰演的主要脚色。
勿论其他,那末,Meta AI 于自监视进修上有哪些研究实践?参数目翻了10倍的 SEER 模子又有哪些新花腔?一路来看看~
1SEER 从 1B 到 10B去年3月初,Meta AI(原 Facebook AI)发布了10亿参数自监视模子 SEER,曾经于 AI 范畴引起广泛存眷。
据 Meta 先容,这是他们于计较机视觉范畴所取患上的第一个基在自监视进修要领的结果:它可以直接从互联网的任一随机图象调集中进修,无需具体的数据治理及标志,随后直接输出图象嵌入。
颠末一年的晋升,如今 Meta 的研究团队将 SEER 的参数目扩展了10倍,于原本的基础上取患了更精彩的机能体现:
除了了可以于无标志数据上直接进修,SEER 还有可以提取更高质量的视觉特性,以和发明实际世界年夜范围图象数据集中的显著信息,方式与人类阐发所不雅察事物之间的瓜葛的方式来相识世界般相似。
留意:这些数据集的笼罩规模是全世界数万亿张随机、未经处置惩罚的图象。

据悉,扩展了10倍密集参数后的 SEER 是当前范围最年夜的密集计较机视觉模子。
他们于 50 多个基准上查验了 SEER 模子的机能,包括公允性、鲁棒性、细粒度辨认,还有于医学成像、卫星图象及光学字符辨认 (OCR) 等范畴的多个图象分类数据集长进行了试验。
不难想象,参数目翻倍后的 SEER 10B模子于一些挑战性较高的使命上也取患了更优异的体现。
起首,100亿 SEER 于 ImageNet 上得到了高达 85.8% 的正确率,排名第一!

除了了于尺度计较机视觉基准上的优异体现外,SEER还有擅优点理高难度使命,并提高了对于域外泛化的鲁棒性。
例如,它可以准确辨认素描图及艺术画中的动物,还有可以弄定常见的图象问题,例如掩装、恍惚、遮挡、运动及独特视角拍摄等。
SEER 10B 模子还有可以或许捕捉年夜量随机的、未颠末滤的互联网图象中存于的光鲜明显信息,甚至超过差别的地舆及语言观点。
例如,纵然该模子仅于没有位置信息或者其他元数据的图象长进行练习,它也可以将全世界多种语言的不异观点组合于一路。例如,未来自世界各地的“婚礼”观点嵌入到模子的特性空间中。

除了了机能的冲破,Meta AI 还有称:SEER 10B 模子能取患上更公允的效果。
他们利用 Meta 新开源的 Casual Conversations 数据集以和他们近来为CV模子提出的新公允基准对于 SEER 举行测试,发明与较小的 SEER 模子以和 ImageNet 练习的监视及自监视模子比拟,SEER 10B 模子能更正确地辨认这些社会成员属性,合用在差别性别、肤色及春秋的人。

图注:该图利用 Casual Conversations 数据集显示了性别检索的正确性
此外,他们利用 Casual Conversations 数据集评估了模子标签的过错率,例如于给定特定的人像中猜测“非人类”或者“犯法”等标签。研究注解,SEER 10B 问题不年夜,但于 ImageNet 上练习的监视模子却孕育发生了年夜量的过错联系关系。

图注:该图显示了 SEER 模子对于差别人群的联系关系猜测过错率
SEER 10B模子还有不仅合用在泰西国度的图象示例,还有合用在全世界各地收入程度中下的地域,之前所未有的精度对于图象举行地舆定位。
经由过程于 Gapminder 的 Dollar Street 数据集(该数据集网络了世界各地家庭中的物体图象和家庭收入信息)上试验,他们还有发明,SEER 10B模子对于辨认全世界中低收入家庭与非西方地域家庭的机能有了年夜幅晋升,且较着优在10亿参数的 SEER 与其他监视要领。

图注:于 Meta AI 在 2020 年创立的数据集 Hateful Memes 上检测多模态(图象 + 文本)愤恨言论时,SEER 10B 的体现也优在受监视的 ImageNet 练习模子 2 个百分点。
2匹敌性进犯Meta AI 的研究团队暗示,秉着“卖力任地开发 AI 体系”的原则,他们还有对于 SEER 10B模子举行了匹敌性进犯,以掩护练习数据的隐私安全。
他们于 Meta 的开源东西 Privacy Linter 长进行了测试,发明进犯的正确度(50.02%)仅略高在彻底随机预测,而随机进犯的正确度对于在不异巨细的练习集,正确度为 50%。
此外,他们计较了差别召回级另外精度,以确保没有练习图象于低召回级别中袒露——这类环境可能发生于所有患上分最高的样本都属在练习集时;同时,精度低在 50.15% 合用在所有级另外召回(包括最初级别)。

图注:因为 SEER 不依靠在标志数据集,以是它可以或许于一组比 ImageNet 的地舆多样性更优的示例上练习模子
为了测试模子于匹敌性进犯中的鲁棒性,他们将模子用在辨认恍惚、插入、已经被裁剪或者颠末其他编纂的扭曲图象。此中,SEER 10B于 CopyDays 基准测试中实现了 90.6% 的平均精度,提高了 5.1%,逾越了以前的最好成果。
此外,SEER 于域外鲁棒性基准上优在于 ImageNet 上练习的开始进的自监视模子,而且跟着范围的增年夜,鲁棒性也不停提高。

今朝,SEER 10B 的模子权重、实现细节与技能文档都已经开放:

项目地址:https://github.com/facebookresearch/vissl/blob/main/projects/SEER/README.md#pretrained-models-weights
3自监视进修与元宇宙自监视进修是 Meta AI 首席科学家 Yann LeCun 最近几年来一直力推的研究标的目的。早于2018年Lecun就暗示,人工智能的下一个成长标的目的多是抛却深度进修的所有几率技巧,转而把握一系列转移能量值的要领。与“通例”的深度进修标志练习要领比拟,这一方式无需创立年夜量带标签的数据集,其基本假想是经由过程获取一些富厚的原始数据(如年夜量Facebook Live视频或者Instagram照片)并“喂”给呆板举行练习,练习的方针是到达能量值越小越好(即猜测更为正确,与实际之间实现更好的兼容性)。

Lecun 2018年于UCSB做的“Self-Supervised Learning”演讲Slide
基在能量的进修早就有之。于AI研究中,“能量函数”是一个上世纪80年月一度风行的“上古”观点,由美国生物物理学家霍普菲尔德(John Hopfield)发现的“霍普菲尔德神经收集”(HNN)引入并普和。Lecun认为,监视进修没法得到像人类同样可以泛化的智能,当 AI 体系再也不需要监视进修时,下一次 AI 革命就会到来,而基在能量的进修恰是“削减监视”的有用实现方式。
Lecun的这一思绪,于他上周接管 IEEE Spectrum 的访谈中也可见一斑。他认为AI想要冲破此刻的瓶颈,必需让呆板进修世界模子,从而可以或许弥补缺掉的信息,猜测将要发生的工作,并猜测步履的影响。这类进修范式与猜测架构的差别,也许也是不久前Lecun对于OpenAI开创人Ilya Sutskever提出的“年夜型神经收集可能成心识”果断说不的缘故原由。
于Lecun的力推下,META缭绕自监视模子取患了一系列的研究结果(例如近来推出的多模态自监视进修新架构deta2vec等)。这类经由过程自监视进修“不雅察世界并进修”、终极实现像人类同样泛化的智能的进修方式,一方面可以最年夜水平使用META富厚的数据资源,同时也是META争先打造元宇宙世界、加快数字世界与实际世界交融的主要技能手腕。
Meta AI Research 团队也暗示,计较机视觉的成长是构建元宇宙的主要步调,而自监视视觉模子 SEER 的加强无疑为元宇宙的更上一层楼作了铺垫。
举例来讲,假如要打造一幅可以或许帮你导航寻觅钥匙或者教你怎样做饭的 AR 眼镜,那末就需要呆板可以或许像人类同样理解视觉世界。这些呆板不但单要能于堪萨斯州及日本京都的厨房中事情,还有要于吉隆坡、北京、纽约等等世界各地的厨房中事情,这就需要呆板能辨认常见物体的多种样子容貌。而 SEER 10B 于多种差别数据集中的强盛机能为实现冲破提供了可能。
参考链接:1.https://ai.facebook.com/blog/seer-10b-better-fairer-computer-vision-through-self-supervised-learning-training-on-diverse-datasets/?__cft__[0]=AZUdZehe1bz4Tl8QchITah3UYSJOxM5A9Ml6XS-IK4l2-IIH1BebGORQtD-N2Z84rVGnL6CFkpLT_tfW-Gc8EgnEh41TGTQl7mNXXxhC9_xvgzTKaOOorJn40G3qNRMEoqJfcndj1xd186wZn6so_sSLjWN1dp-QhJDipaWL5namAg __tn__=-UK-R2.https://arxiv.org/pdf/2202.11960v1.pdf
雷峰网雷峰网(公家号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





