AI Agent 驱动的开源视频生成工作台
分类:视频生成模型
开源 AI 视频生成工作台 — 从小说到短视频,全程 AI Agent 驱动

核心能力:
工作流程:

快速开始:默认部署(SQLite)
git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy
cp .env.example .env
docker compose up -d
# 访问 http://localhost:1241
生产部署(PostgreSQL):
cd ArcReel/deploy/production
cp .env.example .env # 需设置 POSTGRES_PASSWORD
docker compose up -d
首次启动后,使用默认账号登录(用户名 admin,密码在 .env 中通过 AUTH_PASSWORD 设置;未设置则首次启动时自动生成并回写到 .env),前往 设置页(/settings)完成配置:
- ArcReel 智能体 — 配置 Anthropic API Key(驱动 AI 助手),支持自定义 Base URL 和模型
- AI 生图/生视频 — 配置至少一个供应商的 API Key(Gemini / 火山方舟 / Grok / OpenAI),或添加自定义供应商
📖 详细步骤请参考 完整入门教程
功能特性:
- 完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片,一键编排
- 多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent,每个 Subagent 独立完成一项任务后返回摘要
- 多供应商支持 — 图片/视频/文本生成均支持 Gemini、火山方舟、Grok、OpenAI 四大预置供应商,全局/项目级可切换
- 自定义供应商 — 接入任何 OpenAI 兼容 / Google 兼容 API(如 Ollama、vLLM、第三方中转),自动发现可用模型并分配媒体类型,与预置供应商享有同等功能
- 两种内容模式 — 说书模式(narration)按朗读节奏拆分片段,剧集动画模式(drama)按场景/对话结构组织
- 渐进式分集规划 — 人机协作切分长篇小说:peek 探测 → Agent 建议断点 → 用户确认 → 物理切分,按需制作
- 风格参考图 — 上传风格图,AI 自动分析并统一应用到所有图片生成,确保全项目视觉一致
- 角色一致性 — AI 先生成角色设计图,后续所有分镜和视频均参考该设计
- 线索追踪 — 关键道具、场景元素标记为"线索",跨镜头保持视觉连贯
- 版本历史 — 每次重新生成自动保存历史版本,支持一键回滚
- 多供应商费用追踪 — 图片/视频/文本全部纳入费用计算,按供应商分策略计费,不同币种分别统计
- 剪映草稿导出 — 按集导出剪映草稿 ZIP,支持剪映 5.x / 6+(操作指南)
- 项目导入/导出 — 整个项目打包归档,方便备份和迁移
供应商支持:
ArcReel 通过统一的 ImageBackend / VideoBackend / TextBackend 协议,支持多个预置供应商和自定义供应商,可在全局或项目级别切换:
图片供应商:
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Nano Banana 2, Nano Banana Pro | 文生图、图生图(多参考图) | 按分辨率查表 (USD) |
| 火山方舟 | Seedream 5.0, Seedream 5.0 Lite, Seedream 4.5, Seedream 4.0 | 文生图、图生图 | 按张计费 (CNY) |
| Grok (xAI) | Grok Imagine Image, Grok Imagine Image Pro | 文生图、图生图 | 按张计费 (USD) |
| OpenAI | GPT Image 1.5, GPT Image 1 Mini | 文生图、图生图(多参考图) | 按张计费 (USD) |
视频供应商:
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Veo 3.1, Veo 3.1 Fast, Veo 3.1 Lite | 文生视频、图生视频、视频延展、负面提示词 | 按分辨率 × 时长查表 (USD) |
| 火山方舟 | Seedance 2.0, Seedance 2.0 Fast, Seedance 1.5 Pro | 文生视频、图生视频、视频延展、音频生成、种子控制、离线推理 | 按 token 用量 (CNY) |
| Grok (xAI) | Grok Imagine Video | 文生视频、图生视频 | 按秒计费 (USD) |
| OpenAI | Sora 2, Sora 2 Pro | 文生视频、图生视频 | 按秒计费 (USD) |
文本供应商:
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Gemini 3.1 Flash, Gemini 3.1 Flash Lite, Gemini 3 Pro | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
| 火山方舟 | Doubao Seed 系列 | 文本生成、结构化输出、视觉理解 | 按 token 用量 (CNY) |
| Grok (xAI) | Grok 4.20, Grok 4.1 Fast 系列 | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
| OpenAI | GPT-5.4, GPT-5.4 Mini, GPT-5.4 Nano | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
自定义供应商:
除预置供应商外,可接入任何 OpenAI 兼容 或 Google 兼容 API:
- 在设置页添加自定义供应商,填入 Base URL 和 API Key
- 自动调用
/v1/models发现可用模型,按名称推断媒体类型(图片/视频/文本) - 与预置供应商享有同等功能:全局/项目级切换、费用追踪、版本管理
供应商选择优先级:项目级设置 > 全局默认。切换供应商时通用设置(分辨率、宽高比、音频等)直接沿用,供应商特有参数保留。

