AI Agent 驱动的开源视频生成工作台

太极混元 发布于 9小时前 分类:视频生成模型

开源 AI 视频生成工作台 — 从小说到短视频,全程 AI Agent 驱动

839f9cf075231b7

核心能力:

🤖 AI Agent 工作流

基于 Claude Agent SDK,编排 Skill + 聚焦 Subagent 多智能体协作,自动完成从剧本创作到视频合成的完整流水线

🎨 多供应商图像生成

Gemini火山方舟GrokOpenAI 及自定义供应商,角色设计图确保角色一致性,线索追踪保证道具/场景跨镜连贯

🎬 多供应商视频生成

Veo 3.1SeedanceGrokSora 2 及自定义供应商,全局/项目级可切换

⚡ 异步任务队列

RPM 速率限制 + Image/Video 独立并发通道,lease-based 调度,支持断点续传

🖥️ 可视化工作台

Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪,内置 AI 助手

工作流程:

53cc346a9de05ab

快速开始:默认部署(SQLite)

git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy
cp .env.example .env
docker compose up -d
# 访问 http://localhost:1241

生产部署(PostgreSQL):

cd ArcReel/deploy/production
cp .env.example .env    # 需设置 POSTGRES_PASSWORD
docker compose up -d

首次启动后,使用默认账号登录(用户名 admin,密码在 .env 中通过 AUTH_PASSWORD 设置;未设置则首次启动时自动生成并回写到 .env),前往 设置页/settings)完成配置:

  1. ArcReel 智能体 — 配置 Anthropic API Key(驱动 AI 助手),支持自定义 Base URL 和模型
  2. AI 生图/生视频 — 配置至少一个供应商的 API Key(Gemini / 火山方舟 / Grok / OpenAI),或添加自定义供应商

📖 详细步骤请参考 完整入门教程

功能特性:

  • 完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片,一键编排
  • 多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent,每个 Subagent 独立完成一项任务后返回摘要
  • 多供应商支持 — 图片/视频/文本生成均支持 Gemini、火山方舟、Grok、OpenAI 四大预置供应商,全局/项目级可切换
  • 自定义供应商 — 接入任何 OpenAI 兼容 / Google 兼容 API(如 Ollama、vLLM、第三方中转),自动发现可用模型并分配媒体类型,与预置供应商享有同等功能
  • 两种内容模式 — 说书模式(narration)按朗读节奏拆分片段,剧集动画模式(drama)按场景/对话结构组织
  • 渐进式分集规划 — 人机协作切分长篇小说:peek 探测 → Agent 建议断点 → 用户确认 → 物理切分,按需制作
  • 风格参考图 — 上传风格图,AI 自动分析并统一应用到所有图片生成,确保全项目视觉一致
  • 角色一致性 — AI 先生成角色设计图,后续所有分镜和视频均参考该设计
  • 线索追踪 — 关键道具、场景元素标记为"线索",跨镜头保持视觉连贯
  • 版本历史 — 每次重新生成自动保存历史版本,支持一键回滚
  • 多供应商费用追踪 — 图片/视频/文本全部纳入费用计算,按供应商分策略计费,不同币种分别统计
  • 剪映草稿导出 — 按集导出剪映草稿 ZIP,支持剪映 5.x / 6+(操作指南
  • 项目导入/导出 — 整个项目打包归档,方便备份和迁移

供应商支持:

ArcReel 通过统一的 ImageBackend / VideoBackend / TextBackend 协议,支持多个预置供应商和自定义供应商,可在全局或项目级别切换:

图片供应商:

供应商 可用模型 能力 计费方式
Gemini (Google) Nano Banana 2, Nano Banana Pro 文生图、图生图(多参考图) 按分辨率查表 (USD)
火山方舟 Seedream 5.0, Seedream 5.0 Lite, Seedream 4.5, Seedream 4.0 文生图、图生图 按张计费 (CNY)
Grok (xAI) Grok Imagine Image, Grok Imagine Image Pro 文生图、图生图 按张计费 (USD)
OpenAI GPT Image 1.5, GPT Image 1 Mini 文生图、图生图(多参考图) 按张计费 (USD)

 

视频供应商:

供应商 可用模型 能力 计费方式
Gemini (Google) Veo 3.1, Veo 3.1 Fast, Veo 3.1 Lite 文生视频、图生视频、视频延展、负面提示词 按分辨率 × 时长查表 (USD)
火山方舟 Seedance 2.0, Seedance 2.0 Fast, Seedance 1.5 Pro 文生视频、图生视频、视频延展、音频生成、种子控制、离线推理 按 token 用量 (CNY)
Grok (xAI) Grok Imagine Video 文生视频、图生视频 按秒计费 (USD)
OpenAI Sora 2, Sora 2 Pro 文生视频、图生视频 按秒计费 (USD)

文本供应商:

供应商 可用模型 能力 计费方式
Gemini (Google) Gemini 3.1 Flash, Gemini 3.1 Flash Lite, Gemini 3 Pro 文本生成、结构化输出、视觉理解 按 token 用量 (USD)
火山方舟 Doubao Seed 系列 文本生成、结构化输出、视觉理解 按 token 用量 (CNY)
Grok (xAI) Grok 4.20, Grok 4.1 Fast 系列 文本生成、结构化输出、视觉理解 按 token 用量 (USD)
OpenAI GPT-5.4, GPT-5.4 Mini, GPT-5.4 Nano 文本生成、结构化输出、视觉理解 按 token 用量 (USD)

自定义供应商:

除预置供应商外,可接入任何 OpenAI 兼容 或 Google 兼容 API:

  • 在设置页添加自定义供应商,填入 Base URL 和 API Key
  • 自动调用 /v1/models 发现可用模型,按名称推断媒体类型(图片/视频/文本)
  • 与预置供应商享有同等功能:全局/项目级切换、费用追踪、版本管理

供应商选择优先级:项目级设置 > 全局默认。切换供应商时通用设置(分辨率、宽高比、音频等)直接沿用,供应商特有参数保留。

0个回复

  • 暂无回复