创建知识库

💡 知识库集成了两大核心能力:一是高效的数据管理与存储能力;二是强大的信息检索增强功能。

  • 在数据管理与存储方面,平台具备从本地文档导入信息。一旦数据被上传,平台能够智能地将知识内容细分为独立的内容片段进行存储,同时赋予用户自定义内容分割规则的权限,如依据特定的分段标识符或字符长度来划分内容,从而确保数据管理的精细化和个性化。
  • 在增强检索方面,知识库提供了多样化的检索手段,使用户能够轻松地从海量内容片段中定位所需信息。其中,全文检索功能尤为突出,它允许用户通过输入关键词,迅速检索并召回相关的内容片段。此外,依托先进的大模型技术,平台能够进一步处理这些召回的内容片段,生成精确且连贯的回复内容,极大地提升了信息检索的效率和用户体验。

使用限制

  • 知识库数量:不限制单用户创建知识库数量。
  • 知识库文件限制:每个知识库不限制文件上传数量;上传的每个文件大小不超过 20 MB;文件类型只支持txt、pdf、md、docx

创建步骤

  1. 进入知识库列表页

点击页面上方的知识库按钮跳转到知识库的首页,点击后进入到知识库的首页。

知识库首页

知识库列表页面

  1. 知识库的创建

点击知识库的新建按钮,进入到新建知识库的页面,支持自定义知识库头像、知识库名称、知识库描述、知识库标签。

知识库新增按钮

知识库新增弹窗

  1. 导入数据 点击添加文档按钮进行知识库文件的上传,需要将本地文件导入到知识库中

  2. 数据清洗 文件上传完成后,点击右上角的下一步按钮,进行数据的清洗。

  3. 分段设置:自动分段与清洗(按照自动设置分段规则与预处理规则)、自定义(填写分段的标识符、分段长度),右侧展示切片后的结果
  4. 索引方式:高质量(调用系统默认的嵌入接口进行处理,以在用户查询时提供更高的准确度)

    知识库新增弹窗

  5. 处理完成 点击右上角的【保存并处理】按钮完成数据的清洗,进行文件数据的嵌入,嵌入完成后,点击右上角的前往文档按钮可跳转到知识库文件列表页

    知识库新增弹窗

  6. 命中测试 进入命中测试页,在左侧查询文本区域,输入一个查询问题,查看大模型生成的回复内容,并点击运行完毕按钮查看召回的内容片段

    知识库新增弹窗

  7. 如果回复的内容不符合预期,分析原因并进行优化:

    • 如果召回的内容片段的相关性不高,或者没有召回正确的内容片段时:
    • 查看关联的知识库是否正确
    • 查看知识库中的内容分段是否合理
  8. 当召回的内容片段正确时:
    • 尝试优化提示词,例如明确指定要调用的知识库,并增加限制等
    • 尝试对分片长度进行调整,减少不相关内容的干扰

其他功能

  1. 知识库创建完成以后,可以在知识库首页看到新增的知识库,包括知识库的文档、字符数、关联应用数、标签信息。
  1. 文件列表中列出的是当前知识库含有的文件以及文件的信息,包括文件名、文件标签、字符数、命中次数、上传时间、状态、操作。
  1. 文件标签设置
  2. 点击操作列表中的【标签设置】按钮,进入文件的标签管理页面
  3. 在标签管理页面,可以对文件本身的标签进行增删改,对于知识库的标签只能查看不能修改,点击保存后完成标签的设置

图7 知识库编辑入口

  1. 文件夹管理 添加多个文档后,可以创立文件夹并对内部文件进行管理
    点击文件列表页右上角的添加文件夹按钮进入创建文件夹的页面,填写文件夹的名称和标签后,点击确认即可完成文件夹的创建。
  1. 文件快管理 添加多个文档后,可以创立文件夹并对内部文件进行管理
  2. 进入文件详情页,在页面中间区域显示的是当前文件每一段落的详情列表,包括段落的序号、启用状态、段落的内容。
  3. 当鼠标悬浮到对应的段落上面时,会展示文件的标签、删除和启用按钮,支持对段落启用、停用、删除操作。
  4. 右上角支持添加段落和分段设置
powered by 飞云 all right reserved,powered by Gitbook该文章修订时间: 2025-04-08 13:23:31

results matching ""

    No results matching ""