跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.zgi.cn/llms.txt

Use this file to discover all available pages before exploring further.

概述

在 ZGI 中,知识库是连接企业私有数据与大模型应用的核心模块。它通过 **RAG(检索增强生成)**把文档、FAQ、制度、产品资料、研究报告等非结构化内容转化为可检索、可召回、可治理的知识资产,让智能体和工作流能够基于可靠上下文回答问题,而不是只依赖模型自身记忆。
核心价值 把企业文档变成可被 AI 检索和引用的上下文层,提升回答准确性、降低幻觉,并支持按工作区、文件夹、文档和分段进行持续维护。

核心概念

概念说明
知识库面向某一业务领域或数据源建立的知识集合,可按工作区管理,也可通过文件夹分类
文档导入知识库的原始资料,系统会记录语言、字数、命中次数、分段数量、索引状态和文件元数据
分段文档被清洗、切分后的最小召回单元,可启用、停用、编辑、删除,也可批量导入
子分段用于更细粒度的内容维护,适合长段落、层级资料和需要精细召回的场景
检索配置支持语义检索、图谱检索、Top K、分数阈值、Rerank 重排等参数设置
命中测试在发布应用前用真实问题验证召回结果,支持单次测试、外部知识库测试、批量测试和测试报告

RAG 工作流程

准备数据

创建知识库并上传文档,或在已有知识库中继续追加资料。

解析与清洗

系统对文件进行解析、清洗、切分,并生成索引任务。

向量化与索引

使用配置的 Embedding 模型生成向量,写入向量索引;启用 GraphFlow 时还会进入抽取、对齐、入库等图谱索引流程。

检索与重排

用户提问后,系统按检索配置召回候选片段,可结合 Rerank 模型提升相关性排序。

生成回答

智能体或工作流将检索到的上下文传递给 LLM,生成有依据的回答。

支持的能力

能力说明
知识库管理创建、查询、更新、删除知识库;按组织或工作区查看知识库列表
文件夹管理创建、编辑、删除知识库文件夹,并支持将知识库移动到指定文件夹
文档管理上传文档、查看详情与元数据、批量启用/停用、归档/取消归档、批量删除
分段维护查看分段、编辑内容、批量导入、启用/停用、删除;查看关键词、Token 数、命中次数
问题增强为分段添加常见问法,支持生成问题、批量导入问题,提高 FAQ 类场景召回稳定性
检索测试支持 hit-testing、外部知识库测试、异步批量测试、测试记录和报告
图谱能力支持知识图谱数据查看和图谱检索,可用于实体关系更强的知识问答

如何构建知识库

  1. 进入控制台的「知识库」模块,点击新建知识库。
  2. 填写名称、描述、所属工作区和图标,选择数据来源类型。
  3. 配置索引方式、Embedding 模型和检索参数;如需实体关系检索,可开启 GraphFlow。
  4. 上传文件或导入已有文件,等待解析、清洗、切分、索引完成。
  5. 进入文档详情页检查分段质量,必要时编辑分段、补充分段问题或子分段。
  6. 在「召回测试」中输入真实业务问题,检查 Top K、阈值和 Rerank 配置是否符合预期。
  7. 将知识库接入智能体或工作流,在应用中作为上下文检索来源使用。

维护与优化建议

  • 按业务主题拆分知识库,避免把完全无关的知识混在同一索引中
  • 优先清理源文档中的目录、页眉页脚、重复免责声明和无效表格,减少噪声
  • 对政策、产品规格、价格、服务条款等高时效内容建立更新责任人,定期归档旧文档
  • 使用分段问题增强 FAQ、规章制度、产品说明等固定问答场景
  • 通过批量测试覆盖高频问题、边界问题和同义问法,避免只凭单个测试样本判断效果
  • 在命中结果过宽时提高分数阈值或收窄知识库;在召回不足时降低阈值、增加 Top K 或优化分段

知识图谱增强检索

传统 RAG 的天花板是”语义相似”——向量检索只能找到措辞类似的段落。但企业场景中,大量问题是关联型的:A 公司的合同 → 条款 → 违约金 → 关联人。这需要的不是语义匹配,而是关系推理。 ZGI 在文档导入时自动抽取实体(公司、人名、合同号、金额、日期)并建立关系边,存入图数据库。当用户查询涉及多实体关联时,图谱路径直接给出完整、准确的结果。
对比维度纯向量检索ZGI 图谱 + 向量
语义匹配? 擅长? 同样支持
关联查询? 无法处理? 图遍历推理
跨文档关联? 文档间孤立? 统一实体图谱
关联型问题回召率70-85%99%+

应用场景

场景示例
企业内部知识问答员工询问”公司的报销流程是什么?“,系统从制度文档中召回对应条款并生成回答
智能客服与 FAQ 自动化客服机器人基于商品说明、售后政策和常见问题回答客户咨询
研发与运维助手把接口文档、部署手册、故障记录做成知识库,辅助排查问题
销售与方案支持检索产品资料、行业案例和报价规则,快速生成客户沟通材料
合规与法务检索检索合同模板、合规制度、审计说明,辅助定位关键条款
私有化部署知识问答在本地模型和私有向量库环境中运行 RAG,满足数据不出域要求

ZGI 知识库的优势

  • 从知识库、文档、分段到子分段的多层级治理,适合长期运营
  • 检索配置可视化,支持语义检索、图谱检索、阈值控制和 Rerank
  • 模型网关联动,可统一管理 Embedding、Rerank、LLM 等模型依赖
  • 支持权限控制,知识库查看、管理、召回测试、文件夹管理和锁定可按角色授权
  • 测试闭环完整,支持单次测试、批量测试、测试历史和报告,便于上线前评估质量

知识库演示视频