Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

发布时间：2024年10月24日

3347

Genmo 推出最新开源视频生成模型 Mochi 1。

Mochi 1 采用了Asymmetric Diffusion Transformer（AsymmDiT）架构，是迄今为止最大的开源视频生成模型，具备100亿参数。
该模型可同时处理文本和视频信号，拥有更强的视觉推理能力，同时优化了内存需求。

视频播放器

00:00

动作流畅、自然：生成的视频帧率达到30帧/秒，持续时间最长可达5.4秒，具备高时间一致性，确保动作连贯且自然。
.

视频播放器

00:00

00:00

00:00

使用上/下箭头键来增高或降低音量。
逼真的物理效果：模型在生成流体动态、毛发模拟和人类行为时，遵循物理法则，生成结果更加自然逼真。
.

视频播放器

00:00

00:00

00:00

使用上/下箭头键来增高或降低音量。
突破“恐怖谷”问题：人类角色的动作和表情流畅连贯，细节丰富，显著提升了视频的真实感和自然度。
视频播放器

00:00

00:00

00:00

使用上/下箭头键来增高或降低音量。