图森未来发布开源大模型“Ruyi”：让RTX 4090实现视频生成的梦想_创作_用户

在智能技术飞速发展的今天，视频生成领域也迎来了新的突破。12月17日，图森未来正式发布了其首款“图生视频”大模型“Ruyi”，并在Hugging Face上推出了Ruyi-Mini-7B版本的开源下载。这一里程碑式的进展，不仅让视频创作变得更加简单快捷，更为创作者提供了新的可能性。

Ruyi的基本信息

“Ruyi”，作为基于DiT架构的图生视频模型，由CasualVAE模块和Diffusion Transformer模型两部分构成。前者负责对视频数据进行压缩与解压，后者则进行视频生成。这一模型总参数量约为7.1B，并且在训练过程中使用了约200M个视频片段，确保生成的视频质量逼真。更重要的是，Ruyi专为消费级显卡（如RTX 4090）优化，能够在普通用户的个人设备上流畅运行。

Ruyi的核心功能

Ruyi能够支持多分辨率和多时长的视频生成，从最小分辨率384384到最大10241024，达到了任意长宽比，最长可以生成120帧，也就是5秒的视频内容。此外，Ruyi的重要创新之一是允许用户通过控制首帧和尾帧来生成视频。这意味用户可以输入多达5个起始帧和5个结束帧，模型将负责生成之间的过渡内容，为创作者减轻了不少负担。

值得注意的是，Ruyi还提供了4档运动幅度控制，让用户可以对视频整体画面的变化程度进行精确调整。更为细致的是，Ruyi具备上、下、左、右和静止五种镜头控制方式，极大地丰富了用户创作的选择。

创新与用户体验

Ruyi的推出，不仅提升了视频生成的效率与质量，同时在动漫与游戏开发的成本上也具有重大意义。图森未来表示，借助Ruyi大模型，动漫和游戏的开发周期将大幅缩短。通过输入关键帧，该模型能够生成后续5秒的内容，显著提高了创作的流畅度与创意释放。

然而，尽管Ruyi展现了诸多优势，目前仍存在一些需要改进的地方，比如手部畸形、多人时面部细节崩坏以及不可控的转场等问题。图森未来表示，将持续进行优化和更新，力争在不久的将来解决这些缺陷。

AI的发展趋势和社会影响

Ruyi的发布，除了展示技术的飞跃外，也引发了人们对于AI生成内容的深思。随着AI绘画、AI写作等技术的普及，我们已经见证了人工智能在创作领域的颠覆性影响。AI的强大能力为创作者提供了前所未有的工具，使得创意的实现变得愈发简单。然而，这也提出了对原创性及版权的挑战。

在这个过程中，用户应当保持审慎，合理利用AI工具，确保艺术创作的独特性与作品的深层价值。同时，行业也应建立相关规范，避免由于技术发展而带来的创作伦理问题，鼓励公正、理性和人性关怀。

未来展望

后续版本的发布，也将为不同需求的创作者提供更具灵活性的选择。随着技术的不断进步，Ruyi也可能会发展出更多具有特色功能的智能视频生成工具，进一步推动创作效率与质量的全面提升。

总之，随着类似Ruyi大模型的出现，AI在视频制作与创作领域的突破将打开新的风向。在这个充满可能性的时代，简单AI等工具将继续成为创作者们的得力助手，帮助他们更好地实现创意与梦想，改变传统创作模式。

无论你是游戏开发者，还是内容创作者，现在正是利用“简单AI”等先进工具，重新定义创作方式的最佳时机。

解放周末！用AI写周报又被老板夸了！点击这里，一键生成周报总结，无脑直接抄 → https://ai.sohu.com/pc/textHome?trans=030001_yljdaikj 返回搜狐，查看更多

责任编辑：