米兰·(milan)中国官方网站-AIGC 席卷 AI 顶会:ICLR 2023 论文得分出炉,扩散模型研究暴增
作者 | 李梅
编纂 | 陈彩娴
11 月 5 日,人工智能顶级集会 ICLR 2023 的评审成果正式发布。
除了了会商提交论文的分数、任命可能性、怎样 rebuttal 以外,Diffusion Model(扩散模子)成为了本年 ICLR 的热点要害词之一,以扩散模子为研究主题的投稿论文数目呈现暴涨,所涵盖的详细标的目的也十分广泛。
ICLR 2023 的论文提交截止日期是本年的 9 月 28 日,间隔文本天生图象模子 DALL·E 2 的问世不外 5 个月,Stable Diffusion 的发布也只是于 8 月份。扩散模子这一波研究热潮,其实是“扩散”患上飞快,AIGC 的鼓起合法时。
1ICLR 2023 审稿概况ICLR 全称是 International Conference on Learning Representations(国际进修表征集会),由深度进修三巨头此中的两位 Yoshua Bengio 及 Yann LeCun 牵头开办在2013年,于人工智能范畴职位地方举足轻重。ICLR 2023 将在 2023 年 5 月 1 日至 5 月 5 日于卢旺达基加利进行。
本届集会总计有 6300 份初始择要投稿及 4922 份颠末评审的投稿,此中颠末评审的投稿比去年增长了 32.2%。于 4922 份投稿中,有 99%(4883)获得了至少 3 份评审,一共有跨越 18500 份评审。
图注:积年ICLR吸收投稿数目ICLR 的审稿分数及定见全数于 OpenReview 平台上公然,一些网友已经经爬取了平台上本轮审稿的论文患上分数据,做了相干排名统计。
论文评分方面,本年的论文平均患上分为 4.95。终极的论文任命成果还没有宣布,参照上一年 32.3% 的任命率,本年共有 1556 篇摆布的论文有但愿被任命,最低均分线于 5.50 分。

图注:ICLR 2023 论文评分漫衍
2扩散模子成年夜热点毫无疑难,扩散模子于本年是一个年夜热点,从 ICLR 2023 的论文投稿环境就能看出,这波研究热潮已经经掀起。
从提交论文的主题来看,最热点的标的目的与往年相差不年夜,强化进修、深度进修、表征进修、图神经收集等仍然是热门。而此中特别惹人注目的,是排于第 14 名的 Diffusion model。
图注:2022 年及 2023 年 ICLR 论文投稿要害词频率比力从下图显示的频率排名变化幅度最年夜的前 10 个论文要害词可以看到,去年的 Diffusion model 还有排于第 173 名。

论文标题问题中的要害词频率也印证了扩散模子的研究热度有多高:

上图是论文标题要害词频率排名变化幅度最年夜的前 10 个要害词,diffusion 位列第 2,从去年的第 132 名年夜幅暴增到第 25 名。
甚至有网友恶作剧,不如就把 ICLR 2023 的名字改成“Diffusion Conference 2023”吧......

据大略统计,ICLR 2023 的论文投稿中,有 100 多篇论文以扩散模子为研究主题,于 233 篇患上分为 7分(含)和以上的论文中,共有 13 篇触及扩散模子。
这些事情所涵盖的详细标的目的也十分广,如高效采样、与其他天生模子联合、于CV/NLP范畴的运用、于多模态范畴的运用、与强化进修联合、份子图建模、扩散模子理论与理解、扩散模子泛化与拓展、扩散模子迁徙、非凡布局数据的建模、鲁棒性与不变性、扩散模子的隐私掩护,以和其他标的目的。
研究提出的天生模子触及多个模态,模子自己的名字也是八门五花,已往几个月使人冷艳的很多天生模子都于此中,如:
来自google的文本天生 3D 模子 DreamFusion(被称为“3D 版 DALL·E”),论文还有获得了 8.0 的高分,总排名第 13。

别的还有有google发布的检索加强的文本天生图象模子 Re-Imagen、文本天生视频模子 Phenaki,Meta 的文本天生视频模子 Make-A-Video等等。
扩散模子所激发的这一波 AIGC 热潮是囊括式的。扩散模子第一次被提出是于 2015 年(DPM,Diffusion Probabilistic Models),直到2020年,UC 伯克利的Pieter Abbeel 等人提出去噪扩散几率模子(Denoising Diffusion Probabilistic Model, DDPM),于图象天生方面击败了 GAN,向世界展示了扩散模子的威力。

论文地址:https://arxiv.org/pdf/2006.11239.pdf
而扩散模子真正最先成为研究热点,本年 4 月 OpenAI 发布的文本天生图象模子 DALL·E 2 居功至伟,以后又有google推出 Imagen,直接对于标 DALL·E 2,文本天生图象范畴从此最先卷了起来。
本年 8 月,草创公司 Stability.AI 发布深度进修文生图模子 Stable Diffusion,开源后更是一石激起千层浪,后续基在扩散模子的文本天生图象模子可以说是愈来愈卷,并很快扩大到文本天生视频、文本天生 3D、文本天生音频等等。
如今,扩散模子已经经当之无愧成为深度天生模子中新的 SOTA,其所激发的 AIGC 热潮已经经势不成挡。
以是,想要进入 AIGC 这一赛道的可以早点步履了。
参考链接:https://twitter.com/shiqiang_w/status/1588714893309804545https://openreview.net/group?id=ICLR.cc/2023/Conferencehttps://guoqiangwei.xyz/iclr2023_stats/iclr2023_submissions.html更多内容,点击下方存眷:扫码添加 AI 科技评论 微旌旗灯号,投稿 进群:
未经「AI科技评论」授权,严禁以任何方式于网页、论坛、社区举行转载!
公家号转载请先于「AI科技评论」后台留言取患上授权,转载时需标注来历并插入本公家号手刺。
雷峰网(公家号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。





