跳转至

整合企业知识库的智能客服系统

整合企业知识库的智能客服系统

基于「多 Agent 分工协作 + RAG 知识增强」双轮驱动的企业级智能客服系统

:material-robot-happy: 多 Agent 协同 :material-book-search: 混合检索 + RAG :material-rocket: 平均响应 ≤ 3s :material-account-tie: 坐席辅助工作台 :material-chart-line: Langfuse 可观测性

立即开始 查看 GitHub


核心能力

多 Agent 协同

基于 LangGraph 的「1+5」架构:1 个调度 Agent 协调 5 个专业 Agent(知识检索 / 业务查询 / 情感分析 / 工单处理 / 对话生成),LangGraph 不可用时自动降级同步编排。

了解架构

混合检索 + RAG

Query 改写 → 向量检索 + BM25 双路召回 → RRF 融合 → Reranker 重排序 → LLM 生成,相似度低于阈值不强答,Recall@5 = 1.0。

查看检索流程

坐席辅助工作台

转接后会话可被坐席接手,支持上下文延续、知识/业务辅助查询、方案沉淀回库,8 个 API 端点补齐人机协同短板。

查看坐席端点

性能优化

HotQueryCache 热点缓存、ModelRouter 大小模型路由、IntentCache 同意图复用、意图识别快通道,知识问答首 Token <1s。

查看性能优化

Langfuse 可观测性

11 个 LLM 调用点全部标记 prompt name/version,trace 可视化全链路,token/cost/latency 自动上报,未配置自动降级。

查看可观测性

降级策略

LLM / BGE / LangGraph / Redis / 业务 API / Langfuse 七层降级保障可用性,主链路永不阻塞。

查看降级策略


性能指标

真实 DeepSeek LLM + BGE 嵌入环境下验证:

指标 目标 实测 达标
Recall@5 ≥ 0.85 1.0
Hit Rate ≥ 0.90 0.9333
幻觉率 ≤ 0.10 0.0
独立解决率 ≥ 60% 80%
平均响应时间 ≤ 3s 2.27s

项目结构概览

app/
├── api/v1/              # 接入层:REST API 端点
│   ├── chat.py          # 对话端点(同步 + SSE 流式)
│   ├── agent.py         # 坐席辅助端点(8 个)
│   └── ...              # 知识库/评估/性能/可观测/运营
├── agents/              # Agent 协同层
│   ├── orchestrator.py  # 调度 Agent
│   ├── graph.py         # LangGraph 状态机编排
│   └── ...              # 5 个专业 Agent + LLMClient
├── core/                # 核心基础设施
│   ├── session.py       # 会话管理(含坐席状态)
│   ├── performance.py   # HotQueryCache / ModelRouter
│   └── langfuse_client.py   # Langfuse 链路追踪
├── knowledge/           # 知识与数据层
│   ├── hybrid_retriever.py  # 混合检索
│   └── ...              # Reranker / 版本管理 / 质量校验
└── schemas/             # Pydantic 数据模型

tests/                   # 668+ 测试用例

下一步