Documentation Index
Fetch the complete documentation index at: https://docs.zgi.cn/llms.txt
Use this file to discover all available pages before exploring further.
在 ZGI 中,知识库是连接企业私有数据与大模型应用的核心模块。它通过 **RAG(检索增强生成)**把文档、FAQ、制度、产品资料、研究报告等非结构化内容转化为可检索、可召回、可治理的知识资产,让智能体和工作流能够基于可靠上下文回答问题,而不是只依赖模型自身记忆。
核心价值
把企业文档变成可被 AI 检索和引用的上下文层,提升回答准确性、降低幻觉,并支持按工作区、文件夹、文档和分段进行持续维护。
核心概念
| 概念 | 说明 |
|---|
| 知识库 | 面向某一业务领域或数据源建立的知识集合,可按工作区管理,也可通过文件夹分类 |
| 文档 | 导入知识库的原始资料,系统会记录语言、字数、命中次数、分段数量、索引状态和文件元数据 |
| 分段 | 文档被清洗、切分后的最小召回单元,可启用、停用、编辑、删除,也可批量导入 |
| 子分段 | 用于更细粒度的内容维护,适合长段落、层级资料和需要精细召回的场景 |
| 检索配置 | 支持语义检索、图谱检索、Top K、分数阈值、Rerank 重排等参数设置 |
| 命中测试 | 在发布应用前用真实问题验证召回结果,支持单次测试、外部知识库测试、批量测试和测试报告 |
RAG 工作流程
准备数据
创建知识库并上传文档,或在已有知识库中继续追加资料。
解析与清洗
系统对文件进行解析、清洗、切分,并生成索引任务。
向量化与索引
使用配置的 Embedding 模型生成向量,写入向量索引;启用 GraphFlow 时还会进入抽取、对齐、入库等图谱索引流程。
检索与重排
用户提问后,系统按检索配置召回候选片段,可结合 Rerank 模型提升相关性排序。
生成回答
智能体或工作流将检索到的上下文传递给 LLM,生成有依据的回答。
支持的能力
| 能力 | 说明 |
|---|
| 知识库管理 | 创建、查询、更新、删除知识库;按组织或工作区查看知识库列表 |
| 文件夹管理 | 创建、编辑、删除知识库文件夹,并支持将知识库移动到指定文件夹 |
| 文档管理 | 上传文档、查看详情与元数据、批量启用/停用、归档/取消归档、批量删除 |
| 分段维护 | 查看分段、编辑内容、批量导入、启用/停用、删除;查看关键词、Token 数、命中次数 |
| 问题增强 | 为分段添加常见问法,支持生成问题、批量导入问题,提高 FAQ 类场景召回稳定性 |
| 检索测试 | 支持 hit-testing、外部知识库测试、异步批量测试、测试记录和报告 |
| 图谱能力 | 支持知识图谱数据查看和图谱检索,可用于实体关系更强的知识问答 |
如何构建知识库
- 进入控制台的「知识库」模块,点击新建知识库。
- 填写名称、描述、所属工作区和图标,选择数据来源类型。
- 配置索引方式、Embedding 模型和检索参数;如需实体关系检索,可开启 GraphFlow。
- 上传文件或导入已有文件,等待解析、清洗、切分、索引完成。
- 进入文档详情页检查分段质量,必要时编辑分段、补充分段问题或子分段。
- 在「召回测试」中输入真实业务问题,检查 Top K、阈值和 Rerank 配置是否符合预期。
- 将知识库接入智能体或工作流,在应用中作为上下文检索来源使用。
维护与优化建议
-
按业务主题拆分知识库,避免把完全无关的知识混在同一索引中
-
优先清理源文档中的目录、页眉页脚、重复免责声明和无效表格,减少噪声
-
对政策、产品规格、价格、服务条款等高时效内容建立更新责任人,定期归档旧文档
-
使用分段问题增强 FAQ、规章制度、产品说明等固定问答场景
-
通过批量测试覆盖高频问题、边界问题和同义问法,避免只凭单个测试样本判断效果
-
在命中结果过宽时提高分数阈值或收窄知识库;在召回不足时降低阈值、增加 Top K 或优化分段
知识图谱增强检索
传统 RAG 的天花板是”语义相似”——向量检索只能找到措辞类似的段落。但企业场景中,大量问题是关联型的:A 公司的合同 → 条款 → 违约金 → 关联人。这需要的不是语义匹配,而是关系推理。
ZGI 在文档导入时自动抽取实体(公司、人名、合同号、金额、日期)并建立关系边,存入图数据库。当用户查询涉及多实体关联时,图谱路径直接给出完整、准确的结果。
| 对比维度 | 纯向量检索 | ZGI 图谱 + 向量 |
|---|
| 语义匹配 | ? 擅长 | ? 同样支持 |
| 关联查询 | ? 无法处理 | ? 图遍历推理 |
| 跨文档关联 | ? 文档间孤立 | ? 统一实体图谱 |
| 关联型问题回召率 | 70-85% | 99%+ |
应用场景
| 场景 | 示例 |
|---|
| 企业内部知识问答 | 员工询问”公司的报销流程是什么?“,系统从制度文档中召回对应条款并生成回答 |
| 智能客服与 FAQ 自动化 | 客服机器人基于商品说明、售后政策和常见问题回答客户咨询 |
| 研发与运维助手 | 把接口文档、部署手册、故障记录做成知识库,辅助排查问题 |
| 销售与方案支持 | 检索产品资料、行业案例和报价规则,快速生成客户沟通材料 |
| 合规与法务检索 | 检索合同模板、合规制度、审计说明,辅助定位关键条款 |
| 私有化部署知识问答 | 在本地模型和私有向量库环境中运行 RAG,满足数据不出域要求 |
ZGI 知识库的优势
-
从知识库、文档、分段到子分段的多层级治理,适合长期运营
-
检索配置可视化,支持语义检索、图谱检索、阈值控制和 Rerank
-
与模型网关联动,可统一管理 Embedding、Rerank、LLM 等模型依赖
-
支持权限控制,知识库查看、管理、召回测试、文件夹管理和锁定可按角色授权
-
测试闭环完整,支持单次测试、批量测试、测试历史和报告,便于上线前评估质量
知识库演示视频