从Vidu到Motus:通用世界模型如何重塑AI生产力底层架构

2026年4月10日,AI领域迎来一则重磅消息:生数科技宣布完成近20亿元人民币B轮融资。这笔资金将全部押注于一个核心技术方向——通用世界模型(FoundationWorldModel)。 从Vidu到Motus:通用世界模型如何重塑AI生产力底层架构 IT技术

技术路线:从单点突破到体系化构建

通用世界模型的核心命题,是让AI真正理解并预测现实世界的运作规律。生数科技采用的UniDiffuser统一建模框架,打通了语言、视频与动作三种模态的边界。这一架构创新的战略意义在于:它将此前割裂的生成式AI能力,整合为统一的感知-推理-行动闭环。 从Vidu到Motus:通用世界模型如何重塑AI生产力底层架构 IT技术

在数字世界维度,Vidu系列模型率先实现了视频生成领域的多个技术突破。声画同出、16秒连续生成、全球首创的参考生视频技术——这些能力背后是自研高效训练与推理架构的强力支撑。ViduQ3在国际权威AI基准测试中登顶全球第一绝非偶然,其工程优化能力已形成竞争壁垒。

范式升级:从虚拟生成到物理行动

更具想象力的是Motus模型。2025年12月开源的世界行动模型,首次验证了具身基础模型的Scalinglaw。这意味着具身智能领域终于拥有了类似大语言模型的scaling法则,为后续能力增长提供了可预测的技术路径。

Motus在多任务场景中较国际主流VLA模型Pi0.5提升约40%的成功率,这一数据背后的技术含义值得深挖:通用世界模型在物理世界中的泛化能力,已经展现出可规模化的应用潜力。机器人从“模块化执行”向“统一智能体”的演进路径由此清晰。

投资逻辑:为什么是现在

阿里云领投、中网投战略入股、百度BV风投持续加码——顶级资本的共识背后,是对通用世界模型成为AGI必经之路的判断。从Vidu在数字内容生产领域的商业化落地,到Motus在具身智能领域的开源生态,生数科技正在构建一套完整的通用智能基础设施。

可以预见,当AI能够同时理解数字世界的内容生成与物理世界的行动逻辑时,生产力边界的拓展将远超当前想象。生数科技的B轮融资,或许正是这轮范式革命的标志性事件。