AI Agent 驱动的开源视频生成工作台

太极混元发布于 9小时前分类：视频生成模型

开源 AI 视频生成工作台 — 从小说到短视频，全程 AI Agent 驱动

839f9cf075231b7

核心能力：

🤖 AI Agent 工作流

基于 Claude Agent SDK，编排 Skill + 聚焦 Subagent 多智能体协作，自动完成从剧本创作到视频合成的完整流水线

🎨 多供应商图像生成

Gemini、火山方舟、Grok、OpenAI 及自定义供应商，角色设计图确保角色一致性，线索追踪保证道具/场景跨镜连贯

🎬 多供应商视频生成

Veo 3.1、Seedance、Grok、Sora 2 及自定义供应商，全局/项目级可切换

⚡ 异步任务队列

RPM 速率限制 + Image/Video 独立并发通道，lease-based 调度，支持断点续传

🖥️ 可视化工作台

Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪，内置 AI 助手

工作流程：

53cc346a9de05ab

快速开始：默认部署（SQLite）

git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy
cp .env.example .env
docker compose up -d
# 访问 http://localhost:1241

生产部署（PostgreSQL）：

cd ArcReel/deploy/production
cp .env.example .env    # 需设置 POSTGRES_PASSWORD
docker compose up -d

首次启动后，使用默认账号登录（用户名 admin，密码在 .env 中通过 AUTH_PASSWORD 设置；未设置则首次启动时自动生成并回写到 .env），前往 设置页（/settings）完成配置：

ArcReel 智能体 — 配置 Anthropic API Key（驱动 AI 助手），支持自定义 Base URL 和模型
AI 生图/生视频 — 配置至少一个供应商的 API Key（Gemini / 火山方舟 / Grok / OpenAI），或添加自定义供应商

📖 详细步骤请参考完整入门教程

功能特性：

完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片，一键编排
多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent，每个 Subagent 独立完成一项任务后返回摘要
多供应商支持 — 图片/视频/文本生成均支持 Gemini、火山方舟、Grok、OpenAI 四大预置供应商，全局/项目级可切换
自定义供应商 — 接入任何 OpenAI 兼容 / Google 兼容 API（如 Ollama、vLLM、第三方中转），自动发现可用模型并分配媒体类型，与预置供应商享有同等功能
两种内容模式 — 说书模式（narration）按朗读节奏拆分片段，剧集动画模式（drama）按场景/对话结构组织
渐进式分集规划 — 人机协作切分长篇小说：peek 探测 → Agent 建议断点 → 用户确认 → 物理切分，按需制作
风格参考图 — 上传风格图，AI 自动分析并统一应用到所有图片生成，确保全项目视觉一致
角色一致性 — AI 先生成角色设计图，后续所有分镜和视频均参考该设计
线索追踪 — 关键道具、场景元素标记为"线索"，跨镜头保持视觉连贯
版本历史 — 每次重新生成自动保存历史版本，支持一键回滚
多供应商费用追踪 — 图片/视频/文本全部纳入费用计算，按供应商分策略计费，不同币种分别统计
剪映草稿导出 — 按集导出剪映草稿 ZIP，支持剪映 5.x / 6+（操作指南）
项目导入/导出 — 整个项目打包归档，方便备份和迁移

供应商支持：

ArcReel 通过统一的 ImageBackend / VideoBackend / TextBackend 协议，支持多个预置供应商和自定义供应商，可在全局或项目级别切换：

图片供应商：

供应商	可用模型	能力	计费方式
Gemini (Google)	Nano Banana 2, Nano Banana Pro	文生图、图生图（多参考图）	按分辨率查表 (USD)
火山方舟	Seedream 5.0, Seedream 5.0 Lite, Seedream 4.5, Seedream 4.0	文生图、图生图	按张计费 (CNY)
Grok (xAI)	Grok Imagine Image, Grok Imagine Image Pro	文生图、图生图	按张计费 (USD)
OpenAI	GPT Image 1.5, GPT Image 1 Mini	文生图、图生图（多参考图）	按张计费 (USD)

视频供应商：

供应商	可用模型	能力	计费方式
Gemini (Google)	Veo 3.1, Veo 3.1 Fast, Veo 3.1 Lite	文生视频、图生视频、视频延展、负面提示词	按分辨率 × 时长查表 (USD)
火山方舟	Seedance 2.0, Seedance 2.0 Fast, Seedance 1.5 Pro	文生视频、图生视频、视频延展、音频生成、种子控制、离线推理	按 token 用量 (CNY)
Grok (xAI)	Grok Imagine Video	文生视频、图生视频	按秒计费 (USD)
OpenAI	Sora 2, Sora 2 Pro	文生视频、图生视频	按秒计费 (USD)

文本供应商：

供应商	可用模型	能力	计费方式
Gemini (Google)	Gemini 3.1 Flash, Gemini 3.1 Flash Lite, Gemini 3 Pro	文本生成、结构化输出、视觉理解	按 token 用量 (USD)
火山方舟	Doubao Seed 系列	文本生成、结构化输出、视觉理解	按 token 用量 (CNY)
Grok (xAI)	Grok 4.20, Grok 4.1 Fast 系列	文本生成、结构化输出、视觉理解	按 token 用量 (USD)
OpenAI	GPT-5.4, GPT-5.4 Mini, GPT-5.4 Nano	文本生成、结构化输出、视觉理解	按 token 用量 (USD)

自定义供应商：

除预置供应商外，可接入任何 OpenAI 兼容 或 Google 兼容 API：

在设置页添加自定义供应商，填入 Base URL 和 API Key
自动调用 /v1/models 发现可用模型，按名称推断媒体类型（图片/视频/文本）
与预置供应商享有同等功能：全局/项目级切换、费用追踪、版本管理

供应商选择优先级：项目级设置 > 全局默认。切换供应商时通用设置（分辨率、宽高比、音频等）直接沿用，供应商特有参数保留。

0个回复

暂无回复

问答社区

AI Agent 驱动的开源视频生成工作台

开源 AI 视频生成工作台 — 从小说到短视频，全程 AI Agent 驱动

核心能力：

🤖 AI Agent 工作流

🎨 多供应商图像生成

🎬 多供应商视频生成

⚡ 异步任务队列

🖥️ 可视化工作台

工作流程：

快速开始：默认部署（SQLite）

生产部署（PostgreSQL）：

功能特性：

供应商支持：

图片供应商：

视频供应商：

文本供应商：

自定义供应商：

0个回复

商城推荐

仪表仪器设备公司企业网站模板，设备公司企业网站

玻璃钢环保设备类网站PbootCms模板不锈钢钢材网站源码

易优模板-手机APP软件推广软件下载站易优源码（带手机端）

图龙网络-模具设计企业站云优模板

易优模板-厨房厨卫五金材料企业网站模板（PC+WAP）

生产厂家企业站-标牌生产厂家企业站云优模板

真空泵水泵设备类网站织梦模板(自适应手机端)

图龙网络-医疗器械器材公司易优网站模板（PC+WAP）

排行榜展示

图龙网络-电子元件器械公司网站模板（PC+WAP）

AIGCMovie功能完整的开源短剧/短视频创作平台

官方正版CHATGPT智能付费创作系统+音乐+视频+AI搜索3.0.6至尊版

Ripro9.0日主题免扩展二开版Ripro全解密无后门对接易支付WordPress博客主题

官方正版CHATGPT智能付费创作系统+音乐+视频3.0.2优化至尊版

官方正版CHATGPT智能付费创作系统+音乐+视频+AI搜索3.0.7开源版

社区问答