业界动态

百度发布自研视频生成模型MuseSteamer

发布日期：2025-07-03

来源：IT之家

7 月 2 日消息，百度商业研发团队发布自研视频生成模型“MuseSteamer”及创作平台“绘想”，MuseSteamer 是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作，打破传统 AIGC 视频“先画面后配音”的割裂流程。

据悉，MuseSteamer 在权威榜单 VBench I2V 中以 89.38% 总分登顶全球第一，支持一张图生成 10 秒 1080p 电影级画质视频，人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言，以及多目标强化学习等技术优化。

据了解，MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版，覆盖从普通创作者到专业影视机构的需求。其中 Turbo 版已上线绘想平台开启限时免费公测，其余版本将于 8 月陆续开放。平台同步启动“跨次元捏合”AI 视频创作大赛，用户通过单图输入可生成动态捏捏乐视频进行参赛。

Magazine.Subscription.jpg

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306116；邮箱：aet@chinaaet.com。

百度大模型 MuseSteamer 视频模型

欢迎查看AET商业航天专题

欢迎查看AET双碳专题

2024基础电子测试测量培训

什么是数字化转型？

《电子技术应用》特约专栏征稿