让静态图像动起来

AnimateDiff 是一个创新的 AI 视频生成框架。只需输入文本或图像，即可利用强大的 Stable Diffusion 模型生态系统，无缝创建令人惊叹的动画，将您的创意变为现实。

立即开始创作

核心概念：模块化动画

AnimateDiff 的魔力在于其巧妙的架构设计，它将“绘制什么”（外观）和“如何移动”（动作）完全分离，通过预训练的动作模块为静态模型注入活力。

文本到视频 (Text-to-Video)

将您的文本描述直接转换为生动的视频剪辑。只需提供场景、角色或概念，系统就会生成与您的描述相匹配的动画。

✍️

1. 输入文本提示词

描述您想看到的场景

↓

🖼️

2. 生成图像帧

基础模型根据文本生成关键帧

↓

🎬

3. 应用动作并合成

动作模块注入动态，合成视频

图像到视频 (Image-to-Video)

让您的静态图像栩栩如生！无论是数字艺术作品还是 AI 生成的图像，AnimateDiff 都可以为其注入活力。

🏞️

1. 输入静态图像

提供您想制作动画的图像

↓

✨

2. 生成动态序列

模型生成细微变化的序列关键帧

↓

🎥

3. 应用动作并合成

动作模块创建自然动态，合成视频

无限的创意应用

从艺术创作到商业应用，AnimateDiff 正在为各个领域带来新的可能性。

🎨 艺术与动画

艺术家和动画师可以快速将草图和概念转化为动画原型，极大地节省了手动制作时间和精力。

🎮 游戏开发

快速生成游戏机制和交互原型的角色动作和场景动画，加速开发流程。

🎬 故事板与概念可视化

将抽象的想法和故事脚本转化为动态的视觉预览，促进团队沟通和项目预演。

📈 动态图形与营销

以高度自动化的方式为视频、广告和演示文稿创建引人注目的动态图形和短片。

🎓 教育与演示

将复杂的概念和教育内容转化为引人入胜的动画视频，增强学习体验和信息传递效率。

📱 社交媒体内容

通过简单的文本描述为社交平台生成新颖有趣的动画帖子和故事，吸引更多关注。

释放创意的强大工具包

AnimateDiff 提供了一系列高级功能，将您从简单的动画制作者转变为拥有完全控制权的导演。

🎥

导演级运镜 (MotionLoRA)

通过轻量级的 LoRA 模型，轻松实现平移、缩放和旋转等专业摄像机运动。

🎭

引导式动作 (ControlNet)

精确地从源视频传输动作或构图，实现高度可控的视频到视频风格转换。

📜

动态叙事 (Prompt Travel)

在动画时间轴的不同节点更改提示词，创建内容和风格随时间平滑演变的动态故事。

🔁

无限长度 (Sliding Window)

通过巧妙的上下文重叠技术突破原生帧限制，生成理论上无限长度的动画。

快速开始指南

准备好在本地部署 AnimateDiff 了吗？以下是您需要了解的系统要求和安装步骤。

系统要求

🖥️
GPU: 需要强大的 NVIDIA 显卡。T2V 推荐至少 8GB 显存，V2V 需要 10GB+。建议 RTX 3060 或更高。
💾
内存和存储: 建议至少 16GB 系统内存。为模型、图像序列和生成的视频准备足够的磁盘空间（建议 1TB）。
⚙️
平台: 支持 Windows 和 Linux。可以通过 AUTOMATIC1111 WebUI 或 ComfyUI 运行。
⚠️
模型兼容性: 目前主要兼容 Stable Diffusion v1.5 模型。

在 A1111 WebUI 中安装

启动 AUTOMATIC1111 WebUI。
转到 Extensions（扩展）页面，点击 “Install from URL”（从 URL 安装）选项卡。
在 URL 字段中，输入 AnimateDiff 扩展的 GitHub 地址： https://github.com/continue-revolution/sd-webui-animatediff
点击安装并等待确认。
<strong>重启 AUTOMATIC1111 WebUI。</strong>
根据文档下载所需的动作模块，并将它们放置在 extensions/sd-webui-animatediff/model/
再次重启 WebUI，即可在 txt2img 页面看到 AnimateDiff 选项。