2. 知识库创建
知识库是 FastGPT 的核心能力之一,它让 AI 能够基于你提供的专属资料来回答问题,而不是只依赖自身的训练知识。可以把公司文档、产品手册、FAQ 等内容导入知识库,AI 对话时会自动检索相关内容作为参考,给出更准确、更贴合业务的回答。
FastGPT 支持多种数据导入方式,包括上传文件(PDF、Word、TXT、Markdown、CSV 等)、手动输入、网页链接抓取等。导入后,系统会自动对内容进行分块和向量化处理,使其具备语义搜索能力——即使用户提问的措辞和原文不同,也能匹配到相关内容。
创建通用知识库

点击左侧导航「知识库」,进入知识库管理页面。

点击右上角「+ 新建」,选择「通用知识库」。

填写名称,选择索引模型、文本理解模型和图片理解模型,然后点击「确认创建」。

进入知识库,点击「新建/导入」按钮选择要上传的文件类型。

导入文件到知识库时,系统需要把内容"切碎"处理,方便后续搜索。以下是各项配置:
PDF 增强解析
- 调用专门的模型解析 PDF,能转成 Markdown 并保留图片,还能识别扫描件。每页消耗 1 积分,耗时较长。
处理方式
- 分块存储:把文本按规则切成小段,适合大多数场景,不需要额外调用 AI,成本低。
- 问答对提取:让 AI 把内容自动整理成问答格式,搜索更精准,但会丢失部分细节。
分块条件
- 设置什么时候才触发分块。比如"原文长度大于 1000"表示内容超过 1000 字符才分块,否则直接完整存储。
索引增强
- 将标题加入索引:给每条索引加上标题名,搜索时标题也能被匹配到。
- 自动生成补充索引:用 AI 生成额外索引,让语义更丰富,提高搜索精度。
- 图片自动索引:用视觉模型自动识别文档中的图片,让图片内容也能被搜到。
分块处理参数
可选"默认"(系统自带规则)或"自定义"。自定义时可调整:
- 分块方式:按段落分块、按固定长度分块、按指定分割符分块(如用"---"切分)。
- 模型识别段落:是否用 AI 辅助识别段落边界,默认关闭。
- 最大段落深度:段落层级的识别深度,如 5 表示最多识别 5 层。
- 最大分块大小:每块的最大字符数,如 1000。
- 索引大小:每条索引的 Token 大小,如 512。值越小索引越精细,值越大覆盖内容越多。

配置完成后在「数据预览」步骤点击文件可以预览分块的情况,没问题后点击「下一步」。

最后点击「开始上传」即可。

上传成功的数据可以在知识库页面找到。
创建 Web 站点同步知识库

点击「+ 新建」,选择「Web 站点同步」。

填写名称,选择模型,然后点击「确认创建」。

点击右上角「开始配置」。

填写Web站点的地址和选择器(指定抓取网页中哪个区域的内容,填入对应的 CSS 选择器即可,默认抓取页面主体内容)。

配置好后点击「开始同步」即可。
创建第三方知识库

点击「+ 新建」,选择「第三方知识库」,选择知识库类型。

填写知识库名称和其他配置。

进入后点击右上角「立即同步」即可同步第三方平台的文件。
知识库优化技巧
- 文档预处理:上传前清理文档中的无关内容(如页眉页脚、水印文字),提升索引质量。
- 合理分段:根据文档类型调整分段长度。FAQ 类内容建议短分段,技术文档建议较长分段以保持上下文完整。
- 补充同义词:在知识点中添加常见的同义表达和相关关键词,提升检索命中率。
- 定期更新:随着业务变化及时更新知识库内容,删除过时信息。
- 搜索测试:利用平台提供的搜索测试功能,持续验证和优化检索效果。