跳到主要内容

使用 Milvus 与 SambaNova

SambaNova 是一个创新的 AI 技术平台,用于加速先进 AI 和深度学习能力的部署。专为企业使用而设计,它使组织能够利用生成式 AI 来提高性能和效率。通过提供 SambaNova Suite 和 DataScale 等尖端解决方案,该平台使企业能够从其数据中提取有价值的见解,推动运营改进并在 AI 领域创造新的机会。

SambaNova AI Starter Kits 是一套开源资源,旨在帮助开发人员和企业使用 SambaNova 部署 AI 驱动的应用程序。这些工具包提供了实用的示例和指南,促进各种 AI 用例的实施,使用户更容易利用 SambaNova 的先进技术。

本教程利用 SambaNova AI Starter Kits 中的 Milvus 集成来构建企业知识检索系统,类似于 RAG(检索增强生成),用于基于企业私有文档的检索和问答。

本教程主要参考 SambaNova AI Starter Kits 官方指南。如果您发现本教程有过时的部分,您可以优先遵循官方指南并向我们创建一个 issue。

先决条件

我们建议使用 Python >= 3.10 且 < 3.12。

访问 SambaNova Cloud 获取 SambaNova API 密钥。

克隆代码仓库

$ git clone https://github.com/sambanova/ai-starter-kit.git
$ d ai-starter-kit/enterprise_knowledge_retriever

更改向量存储类型

通过在 src/document_retrieval.py 中的 create_vector_store()load_vdb() 函数中设置 db_type='milvus' 来更改向量存储。

...
vectorstore = self.vectordb.create_vector_store(
..., db_type='milvus'
)
...
vectorstore = self.vectordb.load_vdb(..., db_type='milvus', ...)

安装依赖

通过运行以下命令安装所需的依赖:

python3 -m venv enterprise_knowledge_env
source enterprise_knowledge_env/bin/activate
pip install -r requirements.txt

启动应用程序

使用以下命令启动应用程序:

$ streamlit run streamlit/app.py --browser.gatherUsageStats false 

之后,您可以在浏览器中看到用户界面: http://localhost:8501/

在 UI 中设置您的 SambaNova API 密钥后,您可以使用 UI 并询问有关您文档的问题。

有关更多详细信息,请参考 SambaNova AI Starter Kits 的企业知识检索 官方文档。