输入原始需求,输出可发布产品。全流程自动化,BOSS 可实时监控和介入。
- 🏭 AI 软件工厂:需求分析 → 架构设计 → 开发 → 测试 → 发布,全链路自动
- 🤖 6 个专业 Agent:analyst / architect / developer / tester / release / assistant
- 💬 Agent 间实时消息:Agent 可直接互相提问,BOSS 实时可见
- 🧠 SOUL 体系:三层 prompt 结构(灵魂 → 角色 → 规则 → 记忆注入)
- 🛡️ 安全隔离:工具白名单 + Workspace 路径防护 + .catown 保护
- 📊 Pipeline Dashboard:实时进度、Agent 通信、产出物管理
- ⚙️ 全可配置:LLM 模型、Pipeline 流程、Agent 角色全部由 JSON 驱动
- Python 3.10+
cd backend && pip install -r requirements.txt配置 LLM(编辑 backend/configs/agents.json):
{
"global_llm": {
"provider": {
"baseUrl": "https://api.openai.com/v1",
"apiKey": "sk-your-key",
"models": [{"id": "gpt-4", "name": "GPT-4", "maxTokens": 8192}]
},
"default_model": "gpt-4"
}
}启动:
cd backend && uvicorn main:app --reload --host 0.0.0.0 --port 8000- 🌐 Web 界面:http://localhost:8000
- 📚 API 文档:http://localhost:8000/docs
catown/
├── backend/
│ ├── agents/ # Agent 核心(SOUL 体系、注册、协作)
│ ├── chatrooms/ # 聊天室系统
│ ├── configs/ # 配置文件(agents.json, pipelines.json, skills.json)
│ ├── llm/ # LLM 客户端(OpenAI 兼容,per-agent 配置)
│ ├── models/ # 数据库模型(含 Pipeline 表)
│ ├── pipeline/ # Pipeline 引擎(核心)
│ ├── routes/ # API 路由
│ ├── tools/ # 工具集合(21 个:文件操作、代码执行、浏览器、搜索、抓取等)
│ └── main.py # 应用入口
├── frontend/ # 前端(Vanilla JS + TailwindCSS 单文件)
├── docs/ # PRD + ADR
└── tests/ # 单元测试 + E2E 测试
| 角色 | 职责 | Gate |
|---|---|---|
analyst |
需求分析,输出 PRD.md | 人工审批 |
architect |
架构设计,输出 tech-spec.md | 自动 |
developer |
编写代码 + 单元测试 | 自动 |
tester |
测试执行,输出 test_report.md | 自动 |
release |
版本管理,输出 CHANGELOG.md | 人工审批 |
assistant |
打杂,协助其他 Agent | — |
每个 Agent 有独立的 SOUL(灵魂)、角色、工具白名单、LLM 模型配置。
| 类别 | 工具 |
|---|---|
| 文件操作 | read_file, write_file, list_files, delete_file, search_files |
| 代码执行 | execute_code(Python + Node.js 沙箱) |
| 网络 | web_search(DuckDuckGo), web_fetch(网页抓取) |
| 协作 | send_direct_message, query_agent, delegate_task, broadcast_message |
| 其他 | retrieve_memory, save_memory, browser, screenshot, github_manager |
- 工具白名单:Agent 仅能调用
agents.json中声明的工具 - 路径校验:统一
_validate_path()— symlink 解析 + 目录穿越检测 +.catown/保护 - Workspace 隔离:每个项目独立目录,Agent 无法访问其他项目数据
- Pipeline 测试:27/27 ✅(含 8 个安全专项测试)
- E2E 集成测试:35/35 ✅
| 模块 | 状态 | 日期 |
|---|---|---|
| 数据模型 + 配置 | ✅ 完成 | 2026-04-07 |
| Pipeline 引擎 + API | ✅ 完成 | 2026-04-07 |
| 前端 Dashboard | ✅ 完成 | 2026-04-07 |
| Git 集成 + 产出物查看 | ✅ 完成 | 2026-04-07 |
| Agent SOUL 体系 | ✅ 完成 | 2026-04-08 |
| Skills 三级注入 (ADR-008) | ✅ 完成 | 2026-04-10 |
| 工具白名单 + Workspace 隔离 | ✅ 完成 | 2026-04-10 |
| 知识图谱 Skill 定义 (ADR-004) | ✅ 完成 | 2026-04-10 |
| 短期记忆 | ⏳ 待做 | — |
| 项目记忆 | ⏳ 待做 | — |
| Choice Box 交互组件 | ⏳ 待做 | — |
| Agent 操作可视化 | ⏳ 待做 | — |
| 聊天框输入体验 | ⏳ 待做 | — |
| 工具临时授权流程 | ⏳ 待做 | — |
| 审计日志 | ⏳ 待做 | — |
| 知识图谱集成(接 Choice Box) | ⏳ 待做 | — |
| 长期记忆 (ChromaDB) | ⏳ 待做 | — |
| 睡眠整理调度器 | ⏳ 待做 | — |
| OMNI 多模态集成 | ⏳ 待做 | — |
| UI/UX Pro Max Phase 2 | ⏳ 待做 | — |
| Knowledge Graph 进阶 | ⏳ 待做 | — |
- PRD(产品需求文档)
- Wiki — ADR 索引、架构决策、开发日志
MIT License