475型角驰压瓦机

首页 > 压瓦机 > 475型角驰压瓦机

朱军发布高可控视频大模型ViduQ1重塑AI生成视频行业未来
发布日期:2025-04-25 16:34:41 作者: 475型角驰压瓦机

  

朱军发布高可控视频大模型ViduQ1重塑AI生成视频行业未来

  随着人工智能技术的迅猛发展,视频生成的准确性与可控性成为行业热议的线中关村论坛年会“未来人工智能先锋论坛”上,清华大学人工智能研究院副院长、生数科技的创始人兼首席科学家朱军,发布了行业首个高可控视频大模型ViduQ1。朱军表示,该模型通过引入多元素控制技术,实现在多主体细节、音效同步和画质增强等多个角度的进展,预计今年4月将全球上线。

  在媒体采访中,朱军强调视频消费的广泛需求和价值密度,让视频生成的商业化进程加快。他提到,2025年将是AI视频商业化加快速度进行发展的关键一年。与语言模型相比,视频模型目前仍然处于起步阶段,行业竞争相对多元,并未出现“一家独大”的格局。

  朱军的团队在视频生成模型上不断进行创新,致力于让生成内容更具可控性。在此之前,用户们在使用AI生成视频时,常常要通过“抽卡”的方式反复尝试,获得理想结果。而通过ViduQ1,用户能在更高的可控性下,轻轻松松实现出场、退场以及坐立等姿态的精准调控。这在某种程度上预示着,用户的创作流程将变得更高效,既能节约时机,也能提升视频内容的沉浸感和感染力。

  值得注意的是,朱军强调,通过将语义指令与参考图的视觉指令相结合,ViduQ1支持角色的位置、大小和运动轨迹等属性的精确调整,特别是在多主体视频生成中,怎么来控制角色之间的相对位置,将是提升生成内容质量的一大难题。同时,该模型还能够同步输出画面和音效,用户都能够精确设置每段音频的时间点,极大的提升了创作的便捷性。

  对未来的发展趋势,朱军表示,视频生成将向更为丰富和多模态的高可控生成发展,尤其是在实现虚实结合和物理世界的交互方面有着更多可能。他的愿景是以视频大模型为起点,推动通用AI的实现。

  谈及当前视频模型行业的竞争状况,朱军指出,目前行业中的勇于探索商业模式的公司各具特色,竞争并不如语言模型那样激烈。这使得他对未来的行业发展充满信心,同时,也代表着团队的创新能力和持续突破至关重要。

  在商业模式选择上,生数科技采取了ToB和ToC两条腿走路的策略。在C端,生数科技的SaaS服务覆盖了超过200个国家和地区,使得用户数在极短的时间内激增至千万。与此同时,在B端,生数科技通过API和模型微调服务了众多行业,包括动漫、广告、影视剧等,形成了强大的市场影响力。

  朱军还谈及融资环境的变化,指出虽然去年下半年融资环境趋于谨慎,但今年整体向好,使得视频模型的商业化进程提速。他认为,行业虽然面临成本挑战,但采用超高的性价比的算力适配以及一直在优化算法模型的策略,可以大大降低生成视频的成本,进一步拓展市场。

  最后,朱军指出,对于视频生成模型仍然有许多技术门槛需要克服,例如支持更长视频时长的生成、增强叙事性等。相信随技术的进步,未来的AI视频生成将实现更丰富的表达和更高的创作自由度,让创作者们能够在这样的领域中发挥出无限的可能性。总之,ViduQ1的推出标志着AI生成视频行业在可控性与效率方面的一个新突破,也为更多创作者提供了全新的工具与平台。返回搜狐,查看更加多

    

下一篇:嘉兴市盈泰五金电子获得一种五金件加工用激光焊接设备及其焊接办法专利


上一篇:春风悦享请求根据标示真值系统的感知功能评测办法专利处理评测办法不一致问题