Skip to content

wtnoa/RAG-KnowledgeBase

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

RAG Knowledge Base

LLM Wiki 本地知识库系统 — 面向 SLG 游戏策划的语义检索引擎
基于 ChromaDB + DeepSeek,规则驱动的文档处理管线

License: MIT Python ChromaDB


🎯 项目简介

一个专为游戏策划团队设计的 本地 LLM Wiki 知识库,将飞书文档自动转化为可语义检索的向量知识库。

核心能力

能力 说明
🔍 语义检索 理解自然语言查询意图,不依赖关键词匹配
💬 Wiki 问答 基于检索结果的 LLM 智能问答,带引用标注
📥 自动入库 飞书文档一键入库,支持批量处理
🧩 混合检索 向量语义 + 文件扫描双通道,智能路由
📐 规则驱动 基于规则的分块和元数据增强,不做 LLM 分块
🤖 Agent 集成 作为 Hermes Agent Skill 运行,自然融入工作流

🏗️ 技术架构

飞书文档 / 本地文件
        │
        ▼
┌──────────────────┐
│   文档入库管线     │  ← 规则分块 + 元数据增强
│  (ingest pipeline) │
└────────┬─────────┘
         │
         ▼
┌──────────────────┐
│   ChromaDB        │  ← 向量存储 (cosine 相似度)
│   (向量数据库)     │
└────────┬─────────┘
         │
         ▼
┌──────────────────┐
│   混合检索引擎     │  ← 向量检索 + 文件扫描
│  (hybrid search)  │
└────────┬─────────┘
         │
         ▼
┌──────────────────┐
│   LLM Wiki Q&A   │  ← DeepSeek v4 问答生成
│   (智能问答)       │
└──────────────────┘

技术栈

组件 技术选型
LLM DeepSeek v4 (pro/flash)
向量数据库 ChromaDB (本地 PersistentClient)
嵌入模型 Qwen/Qwen2.5-7B-Instruct
文档源 飞书文档 API / 本地文件
Agent 框架 Hermes Agent
运行环境 WSL Ubuntu 22.04 + Python 3.10

🚀 快速体验

# 1. 安装依赖
pip install chromadb openai pyyaml

# 2. 配置 LLM API
cp config.example.yaml config.yaml
# 编辑 config.yaml 填入你的 DeepSeek API Key

# 3. 启动向量库
python kb_query_cli.py --mode serve

# 4. 语义检索
python kb_query_cli.py -q "兵种克制关系是什么?"

📊 项目规模

指标 数值
入库脚本 90+
支持文档数 228 篇飞书文档
策划模块 30 个(框架设计/战斗/武将/地图...)
检索模式 3 种(向量/混合/Wiki Q&A)
Prompt 模板 3 套(默认/对话感知/降级)

📁 目录结构

RAG-KnowledgeBase/
├── README.md               # 项目说明
├── LICENSE                 # MIT 许可证
├── config.example.yaml     # 配置模板
├── scripts/                # 核心脚本(入库/检索/检查)
├── configs/                # Prompt 模板 & 模块映射
├── service/                # Web 服务(FastAPI)
├── data/                   # 文档索引数据
└── chroma_data/            # 向量数据(本地)

🧠 设计原则

  • 规则优先:分块、元数据提取全部规则驱动,避免 LLM 不确定性
  • 本地优先:向量库本地部署,数据不出内网
  • Agent 原生:作为 Hermes Skill 运行,AI Agent 可直接调用
  • 智能路由:根据查询类型自动选择检索策略

📄 许可证

MIT License — 详见 LICENSE


Built for game designers, powered by LLM Wiki.

About

RAG 向量知识库 - SLG 游戏策划案检索系统。基于 ChromaDB + DeepSeek 的语义检索引擎,支持混合检索、Wiki 问答、飞书文档自动入库。90+ 脚本,规则驱动的文档处理管线。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors