使用 Milvus 的 Kotaemon RAG
Kotaemon 是一个开源的简洁且可定制的 RAG UI,用于与您的文档进行聊天。同时为最终用户和开发者而构建。
Kotaemon 提供了一个可定制的多用户文档问答 Web UI,支持本地和基于 API 的 LLM。它提供了一个混合 RAG 流水线,具有全文和向量检索功能,支持包含图形和表格的文档的多模态问答,以及带有文档预览的高级引用。它支持复杂的推理方法,如 ReAct 和 ReWOO,并为检索和生成提供可配置的设置。
本教程将指导您如何使用 Milvus 自定义您的 kotaemon 应用程序。
先决条件
安装
我们建议以这种方式安装 kotaemon:
# 可选(设置环境)
conda create -n kotaemon python=3.10
conda activate kotaemon
git clone https://github.com/Cinnamon/kotaemon
cd kotaemon
pip install -e "libs/kotaemon[all]"
pip install -e "libs/ktem"
除了这种方式,还有其他一些安装 kotaemon 的方法。您可以参考官方文档获取更多详细信息。
将 Milvus 设置为默认向量存储
要将默认向量存储更改为 Milvus,您必须通过将 KH_VECTORSTORE
切换为以下内容来修改 flowsettings.py
文件:
"__type__": "kotaemon.storages.MilvusVectorStore"
设置环境变量
您可以通过 .env
文件配置模型,其中包含连接 LLM 和嵌入模型所需的信息。例如 OpenAI、Azure、Ollama 等。
运行 Kotaemon
设置环境变量并更改向量存储后,您可以通过运行以下命令来运行 kotaemon:
python app.py
默认用户名/密码是:admin
/ admin
开始使用 kotaemon 进行 RAG
1. 添加您的 AI 模型
在 Resources
选项卡中,您可以添加和设置您的 LLM 和嵌入模型。您可以添加多个模型并将它们设置为活动或非活动状态。您只需提供至少一个。您也可以提供多个模型以允许在它们之间切换。
2. 上传您的文档
为了对您的文档进行问答,您需要首先将它们上传到应用程序中。
导航到 File Index
选项卡,您可以上传和管理您的自定义文档。
默认情况下,所有应用程序数据都存储在 ./ktem_app_data
文件夹中。Milvus 数据库数据存储在 ./ktem_app_data/user_data/vectorstore
中。您可以备份或复制此文件夹以将您的安装移动到新机器上。
3. 与您的文档聊天
现在导航回 Chat
选项卡。聊天选项卡由 3 个区域组成:会话设置面板,您可以在其中管理会话和文件引用;用于与聊天机器人交互的聊天面板;以及信息面板,显示答案的支持证据、置信度分数和相关性评级。
您可以在会话设置面板中选择您的文档。然后只需在输入框中输入消息并将其发送给聊天机器人,即可开始与您的文档进行 RAG。
如果您想深入了解如何使用 kotaemon,您可以从官方文档获得完整的指导。