欢迎进入爱游戏直播网页版官网!
案例现场
最新动态
当前位置:首页 > 爱游戏app官方网站 > 制砂机设备 > 河卵石制砂机

【48812】直接生成16秒高清视频 我国自研视频大模型在京发布

来源: 河卵石制砂机 发布时间: 2024-07-28 10:04:32

  新华社北京4月27日电(记者魏梦佳)只需一段文字指令就能生成一段传神视频,今年初,文生视频大模型Sora在全球AI业界外引发广泛重视。27日,2024中关村论坛年会上初次发布我国自研的具“长时长、高一致性、高动态性”特色的文生视频大模型Vidu。

  记者从会上得悉,这一视频大模型由清华大学联合北京生数科技有限公司一起研制,可根据文本描绘直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模仿实在物理国际,还具有丰厚想象力。

  清华大学AI研究院副院长、生数科技首席科学家朱军说,当时国内视频大模型的生成视频时长大多为4秒左右,Vidu则可完成一次性生成16秒的视频时长。一起,视频画面能坚持连接流通,跟着镜头移动,人物和场景在时刻、空间中能坚持高一致性。

  在动态性方面,Vidu能生成杂乱的动态镜头,不再局限于简略的推、拉、移等固定镜头,而是能在一段画面里完成前景、近景、中景、特写等不同镜头的切换,包含能直接生成长镜头、追焦、转场等作用。

  “Vidu能模仿实在物理国际,生成细节杂乱且契合物理规则的场景,例如合理的光影作用、细腻的人物表情等,还能创造出具有深度和杂乱性的超现实主义内容。”朱军介绍,因为选用“一步到位”的生成方法,视频片段自始至终接连生成,无明显的插帧现象。

  据悉,Vidu的技能打破源于团队在机器学习和多模态大模型方面的长时间堆集,其核心技能架构由团队早在2022年就提出并继续展开自主研制。“作为一款通用视觉模型,咱们一直信任,Vidu未来能支撑生成愈加多样化、更长时长的视频内容,探究不同的生成使命,其灵敏架构也将兼容更广泛的模态,进一步拓宽多模态通用才能的鸿沟。”朱军说。

推荐产品
制砂机设备
破碎机设备

扫一扫关注我们
回到顶部