LLM Wiki 本地知识库系统 — 面向 SLG 游戏策划的语义检索引擎
基于 ChromaDB + DeepSeek,规则驱动的文档处理管线
一个专为游戏策划团队设计的 本地 LLM Wiki 知识库,将飞书文档自动转化为可语义检索的向量知识库。
| 能力 | 说明 |
|---|---|
| 🔍 语义检索 | 理解自然语言查询意图,不依赖关键词匹配 |
| 💬 Wiki 问答 | 基于检索结果的 LLM 智能问答,带引用标注 |
| 📥 自动入库 | 飞书文档一键入库,支持批量处理 |
| 🧩 混合检索 | 向量语义 + 文件扫描双通道,智能路由 |
| 📐 规则驱动 | 基于规则的分块和元数据增强,不做 LLM 分块 |
| 🤖 Agent 集成 | 作为 Hermes Agent Skill 运行,自然融入工作流 |
飞书文档 / 本地文件
│
▼
┌──────────────────┐
│ 文档入库管线 │ ← 规则分块 + 元数据增强
│ (ingest pipeline) │
└────────┬─────────┘
│
▼
┌──────────────────┐
│ ChromaDB │ ← 向量存储 (cosine 相似度)
│ (向量数据库) │
└────────┬─────────┘
│
▼
┌──────────────────┐
│ 混合检索引擎 │ ← 向量检索 + 文件扫描
│ (hybrid search) │
└────────┬─────────┘
│
▼
┌──────────────────┐
│ LLM Wiki Q&A │ ← DeepSeek v4 问答生成
│ (智能问答) │
└──────────────────┘
| 组件 | 技术选型 |
|---|---|
| LLM | DeepSeek v4 (pro/flash) |
| 向量数据库 | ChromaDB (本地 PersistentClient) |
| 嵌入模型 | Qwen/Qwen2.5-7B-Instruct |
| 文档源 | 飞书文档 API / 本地文件 |
| Agent 框架 | Hermes Agent |
| 运行环境 | WSL Ubuntu 22.04 + Python 3.10 |
# 1. 安装依赖
pip install chromadb openai pyyaml
# 2. 配置 LLM API
cp config.example.yaml config.yaml
# 编辑 config.yaml 填入你的 DeepSeek API Key
# 3. 启动向量库
python kb_query_cli.py --mode serve
# 4. 语义检索
python kb_query_cli.py -q "兵种克制关系是什么?"| 指标 | 数值 |
|---|---|
| 入库脚本 | 90+ |
| 支持文档数 | 228 篇飞书文档 |
| 策划模块 | 30 个(框架设计/战斗/武将/地图...) |
| 检索模式 | 3 种(向量/混合/Wiki Q&A) |
| Prompt 模板 | 3 套(默认/对话感知/降级) |
RAG-KnowledgeBase/
├── README.md # 项目说明
├── LICENSE # MIT 许可证
├── config.example.yaml # 配置模板
├── scripts/ # 核心脚本(入库/检索/检查)
├── configs/ # Prompt 模板 & 模块映射
├── service/ # Web 服务(FastAPI)
├── data/ # 文档索引数据
└── chroma_data/ # 向量数据(本地)
- 规则优先:分块、元数据提取全部规则驱动,避免 LLM 不确定性
- 本地优先:向量库本地部署,数据不出内网
- Agent 原生:作为 Hermes Skill 运行,AI Agent 可直接调用
- 智能路由:根据查询类型自动选择检索策略
MIT License — 详见 LICENSE
Built for game designers, powered by LLM Wiki.