可灵大模型是由快手大模型团队自研打造的一款AI视频生成大模型。该模型具备以下特点和优势:
· 3D时空注意力机制:可灵大模型能够通过3D时空联合注意力机制更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时符合运动规律。
· 长达2分钟的视频生成:得益于高效的训练基础设施和极致的推理优化,可灵大模型能够生成长达2分钟、30fps的1080p高分辨率视频。
· 模拟物理世界特性:基于自研模型架构及Scaling Law,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
· 强大的概念组合能力:通过对文本-视频语义的深刻理解和Diffusion Transformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的场景。
· 电影级的画面生成:可灵大模型能够生成1080p分辨率的电影级视频,无论是宏大场景还是细腻的特写镜头,都能生动呈现。
· 支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,支持多种视频宽高比,满足不同场景下的视频素材需求。