首页 > Ai资讯 > Ai日报 > Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

发布时间:2024年10月24日

Genmo 推出最新开源视频生成模型 Mochi 1。

  • Mochi 1 采用了Asymmetric Diffusion Transformer(AsymmDiT)架构,是迄今为止最大的开源视频生成模型,具备100亿参数。
  • 该模型可同时处理文本和视频信号,拥有更强的视觉推理能力,同时优化了内存需求。

功能特点:

1. 高保真动作生成
2. 强大的文本提示响应
  • 精确的提示对齐:Mochi 1 能根据用户的文本指令,生成与描述高度一致的场景、角色和动作。
  • 多模态融合:模型在处理视觉和文本提示时使用多模态自注意力机制,实现文本和视频的协同处理,使得生成结果符合用户预期。

衡量生成的视频遵循所提供的文本指令的准确程度,确保高度保真用户意图

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。


如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。