当前位置：首页 > 爱游戏app官方网站 > 制砂机设备 > 河卵石制砂机

【48812】直接生成16秒高清视频我国自研视频大模型在京发布

来源：河卵石制砂机发布时间： 2024-07-28 10:04:32

　　新华社北京4月27日电（记者魏梦佳）只需一段文字指令就能生成一段传神视频，今年初，文生视频大模型Sora在全球AI业界外引发广泛重视。27日，2024中关村论坛年会上初次发布我国自研的具“长时长、高一致性、高动态性”特色的文生视频大模型Vidu。

　　记者从会上得悉，这一视频大模型由清华大学联合北京生数科技有限公司一起研制，可根据文本描绘直接生成长达16秒、分辨率高达1080P的高清视频内容，不仅能模仿实在物理国际，还具有丰厚想象力。

　　清华大学AI研究院副院长、生数科技首席科学家朱军说，当时国内视频大模型的生成视频时长大多为4秒左右，Vidu则可完成一次性生成16秒的视频时长。一起，视频画面能坚持连接流通，跟着镜头移动，人物和场景在时刻、空间中能坚持高一致性。

　　在动态性方面，Vidu能生成杂乱的动态镜头，不再局限于简略的推、拉、移等固定镜头，而是能在一段画面里完成前景、近景、中景、特写等不同镜头的切换，包含能直接生成长镜头、追焦、转场等作用。

　　“Vidu能模仿实在物理国际，生成细节杂乱且契合物理规则的场景，例如合理的光影作用、细腻的人物表情等，还能创造出具有深度和杂乱性的超现实主义内容。”朱军介绍，因为选用“一步到位”的生成方法，视频片段自始至终接连生成，无明显的插帧现象。

　　据悉，Vidu的技能打破源于团队在机器学习和多模态大模型方面的长时间堆集，其核心技能架构由团队早在2022年就提出并继续展开自主研制。“作为一款通用视觉模型，咱们一直信任，Vidu未来能支撑生成愈加多样化、更长时长的视频内容，探究不同的生成使命，其灵敏架构也将兼容更广泛的模态，进一步拓宽多模态通用才能的鸿沟。”朱军说。

上一篇:辨识AI视频越来越难？办法不是没有下一篇:【48812】湖北澳特尔化工有限公司

爱游戏直播网页版

爱游戏app官网下载

【48812】直接生成16秒高清视频 我国自研视频大模型在京发布

【48812】直接生成16秒高清视频我国自研视频大模型在京发布