成品演示视频: https://imgur.com/a/JfPhJ32 (一条 Prompt 自动生成,带旁白、背景音乐、字幕,17 秒完整成片)
做了一个开源项目 AgentCut,用 6 个 AI Agent 协作完成从文字描述到成片的全流程视频生产。
GitHub: https://github.com/calderbuild/agentcut
它能做什么
输入一段文字描述(比如”东京日落的电影感航拍”),6 个 Agent 按流水线自动工作:
- Director Agent — 分析创意方向,规划分镜
- Script Agent — 编写制作脚本(视频提示词、旁白、字幕)
- Visual Agent — 生成视频片段( Hailuo 2.3, 1080P )
- Voice Agent — 合成旁白语音( Speech-2.6-HD )
- Music Agent — 生成背景音乐( Music-2.0 )
- Editor Agent — ffmpeg 合成最终 MP4
其中 Visual 、Voice 、Music 三个 Agent 并行执行,Editor 等三者完成后合成。
截图
首页:
Pipeline 运行中( 6 个 Agent 实时状态 + Production Log ):
技术栈
- LLM: MiniMax M1
- 视频生成: MiniMax Hailuo 2.3
- 语音合成: MiniMax Speech-2.6-HD
- 背景音乐: MiniMax Music-2.0
- 合成: ffmpeg
- 后端: Python FastAPI + SSE 实时推送
- 前端: HTML + Tailwind CSS
快速开始
git clone https://github.com/calderbuild/agentcut.git
cd agentcut
pip install -r backend/requirements.txt
cp .env.example .env # 填入 MiniMax API Key
python -m backend.main
也支持 Docker 一键部署。每个视频生成成本约 $0.40-0.70 。
MIT 协议,欢迎 Star / Fork / PR 。
Leave a Reply Cancel reply