米兰·(milan)中国官方网站-开源全家桶又添一“元”,腾讯混元大模型公布最新进展
方才,腾讯混元年夜模子宣布最新进展:正式上线视频天生能力,这是继文生文、文生图、3D天生以后的又一新里程碑。与此同时,腾讯开源该视频天生年夜模子,参数目130亿,是当前最年夜的视频开源模子。
“用户只需要输入一段描写,便可天生视频,”腾讯混元相干卖力人吐露,今朝的天生视频撑持中英文双语输入、多种视频尺寸以和多种视频清楚度。今朝该模子已经上线腾讯元宝APP,用户可于AI运用中的“AI视频”板块申请试用。企业客户经由过程腾讯云提供办事接入,今朝API同步开放内测申请。

经由过程腾讯元宝APP-AI运用-AI视频便可利用该功效(前期需申请)
于与海内外多个顶尖模子的评测对于比显示,混元视频天生模子于文本视频一致性、运动质量及画面质量多个维度效果领先,于人物、人造场合等场景下体现尤为精彩。

腾讯混元视频天生年夜模子建造出的视频画质很传神,内容也与提醒词高度一致,确保画面的流利性,削减形变,甚至于提醒词是 emoji 心情的环境下,也能够不变输出。
例如,于处置惩罚冲浪、跳舞等包罗年夜幅度动作的场景时,该模子可以或许天生流利且合理的动作镜头,物体形变征象获得有用节制;于处置惩罚光影反射时,它可以或许基本遵照物理纪律,如于镜面或者照镜子的场景中,可以或许实现镜表里动作的一致性。此外,该模子还有能于连结画面主角稳定的环境下主动切换镜头,这是很多其他模子所不具有的高级功效。

视频由腾讯混元视频天生,提醒词:200妹妹长焦镜头,瞄准一只停于雕栏上的海鸥。羽毛的纹理清楚可辨,远景的木雕栏温柔虚化。远处的夕阳及海平面熔化成金红色的光影

视频由腾讯混元视频天生,提醒词:狂风雪中,一列蒸汽火车于坎坷山间穿行,黑烟从车头直冲云霄,车箱于皑皑白雪中留下艰深轨迹,镜头以侧面追踪,捕获机械巨兽破开风雪的磅礴气魄,白雾与蒸汽交叉成壮丽画卷,影戏气氛,前景

视频由腾讯混元视频天生,提醒词:一个隐蔽的瀑布流入清亮的水池,周围是高峻的树木及绿色植物。阳光穿过树叶,于下面的岩石及水面上形成雀斑。传神,茂密丛林中的安好瀑布,安好、阳光亮媚的日子,中景

视频由腾讯混元视频天生,提醒词:一名戴着复旧飞行护目镜的机械师,半跪于蒸汽朋克气势派头的事情室里。她棕色卷发挽成发髻,零散的银色发丝闪着金属光泽。深棕色皮质工装违带裤上沾满机油污渍,袖口卷起露出充满齿轮纹身的手臂。特写她正用黄铜东西调试一只机械鸟,齿轮间冒出缕缕蒸汽,事情台上散落着铜管、发条及老式图纸。
它采用了与Sora相似的DiT架构,并于此基础长进行了多项优化。混元的视频天生模子经由过程引入新一代的文本编码器,显著加强了对于语义的理解及遵照能力,这使患上它于处置惩罚多主体场景时可以或许越发切确地履行指令并出现细节;此外,该模子还有采用了同一的全留意力机制,这不仅让视频帧之间的过渡越发天然,还有实现了于连结主体一致性的条件下举行多视角切换;末了,混元经由过程采用进步前辈的图象视频混淆VAE技能(3D变分编码器),于细节捕获上取患了显著前进,尤其是于处置惩罚小尺寸人脸及快速运动镜甲等繁杂场景时体现尤为凸起。
今朝,腾讯公布开源该视频天生年夜模子已经于 Hugging Face 平台和 Github 上发布,包罗模子权重、推理代码、模子算法等完备模子,可供企业与小我私家开发者免费利用及开发生态插件。基在腾讯混元的开源模子,开发者和企业无需重新练习,便可直接用在推理,并可基在腾讯混元系列打造专属运用和办事,可以或许勤俭年夜量人力和算力,加快行业立异程序。
据雷峰网(公家号:雷峰网)相识,从年头以来,腾讯混元系列模子的开源速率不停加速。此前,腾讯混元已经经开源了旗下文生文、文生图及3D天生年夜模子。至此,腾讯混元系列年夜模子已经实现周全开源。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





