Ollama调用Embedding models实现RAG应用代码报错

运行ollama的Embedding models报错，但不知道原因

import ollama
import chromadb

documents = [
  "Llamas are members of the camelid family meaning they're pretty closely related to vicuñas and camels",
  "Llamas were first domesticated and used as pack animals 4,000 to 5,000 years ago in the Peruvian highlands",
  "Llamas can grow as much as 6 feet tall though the average llama between 5 feet 6 inches and 5 feet 9 inches tall",
  "Llamas weigh between 280 and 450 pounds and can carry 25 to 30 percent of their body weight",
  "Llamas are vegetarians and have very efficient digestive systems",
  "Llamas live to be about 20 years old, though some only live for 15 years and others live to be 30 years old",
]

client = chromadb.Client()
collection = client.create_collection(name="docs")

# store each document in a vector embedding database
for i, d in enumerate(documents):
  response = ollama.embeddings(model="mxbai-embed-large", prompt=d)
  embedding = response["embedding"]
  collection.add(
    ids=[str(i)],
    embeddings=[embedding],
    documents=[d]
  )

  # an example prompt
  prompt = "What animals are llamas related to?"

  # generate an embedding for the prompt and retrieve the most relevant doc
  response = ollama.embeddings(
    prompt=prompt,
    model="mxbai-embed-large"
  )
  results = collection.query(
    query_embeddings=[response["embedding"]],
    n_results=1
  )
  data = results['documents'][0][0]

  # generate a response combining the prompt and data we retrieved in step 2
  output = ollama.generate(
    model="llama2",
    prompt=f"Using this data: {data}. Respond to this prompt: {prompt}"
  )

  print(output['response'])

python3.11 /Users/admin/project/py/rag/ollama/ola1.py 
Traceback (most recent call last):
  File "/Users/admin/project/py/rag/ollama/ola1.py", line 18, in <module>
    response = ollama.embeddings(model="mxbai-embed-large", prompt=d)
               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/Users/admin/anaconda3/lib/python3.11/site-packages/ollama/_client.py", line 198, in embeddings
    return self._request(
           ^^^^^^^^^^^^^^
  File "/Users/admin/anaconda3/lib/python3.11/site-packages/ollama/_client.py", line 73, in _request
    raise ResponseError(e.response.text, e.response.status_code) from None
ollama._types.ResponseError

Process finished with exit code 1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-05-01 20:56
关注
参考免费微信小程序：皆我百晓生 作答，经由专家-皆知整理回复，如问题解决，望采纳；如仍有疑问，请评论回复。

看起来你在尝试使用 Ollama 库与 ChromaDB 结合，创建一个基于嵌入向量的文档检索系统。从错误信息来看，ollama._types.ResponseError 表示在发送请求时遇到了问题，具体是服务器返回了非 200 状态码的响应。

首先，我们需要确保你已经正确安装了 ollama 和 chromadb 包，并且它们的版本兼容。请检查你的 Python 环境是否正确设置，可以尝试更新这两个包到最新版本：

pip install --upgrade ollama chromadb

接下来，让我们检查一下可能的问题：

确保你已连接到互联网，因为 Ollama 需要通过网络访问模型服务。
检查你的 OLLAMA_API_KEY 环境变量是否设置正确。这个环境变量用于提供 Ollama API 的访问密钥。如果没有设置，你需要去 Ollama官网注册并获取 API 密钥，然后设置环境变量：
export OLLAMA_API_KEY=<your_api_key>

如果你已经设置了正确的 API 密钥并且网络连接正常，那么可能是 Ollama 的模型服务暂时不可用，或者你使用的模型名称（例如 "mxbai-embed-large"）不正确。你可以尝试使用其他可用的模型名称，或者稍后再试。

这里是一个修改后的代码片段，包含了对 API 密钥的检查以及使用默认的模型名作为备选方案：

import os import ollama import chromadb # Check if OLLAMA_API_KEY is set if 'OLLAMA_API_KEY' not in os.environ: raise ValueError("Please set the environment variable 'OLLAMA_API_KEY' with your Ollama API key.") api_key = os.environ['OLLAMA_API_KEY'] documents = [ # ... (Your document list remains unchanged) ] client = chromadb.Client() collection = client.create_collection(name="docs") # store each document in a vector embedding database for i, d in enumerate(documents): try: # Use default model if mxbai-embed-large fails model_name = "mxbai-embed-large" if model_name not in ollama.available_models(): model_name = ollama.default_model_name() response = ollama.embeddings(api_key=api_key, model=model_name, prompt=d) embedding = response["embedding"] collection.add( ids=[str(i)], embeddings=[embedding], documents=[d] ) except ollama.RequestError as e: print(f"Failed to embed document {i} due to error: {e}") continue # ... (The rest of the code remains unchanged)

在这个修改过的代码中，我们首先检查了 OLLAMA_API_KEY 是否已经设置，然后在尝试使用特定模型之前，先检查它是否存在于可用模型列表中。如果不存在，就使用默认模型。这样可以避免因模型名错误导致的问题。同时，添加了一个异常处理块，当遇到请求错误时，会捕获并打印错误信息，而不是让整个程序崩溃。

按照上述步骤操作后，如果问题仍然存在，请检查你的网络连接和 API 密钥，或者联系 Ollama 官方支持寻求进一步的帮助。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

embedding 矩阵是根据什么来生成的呢 word2vec 自然语言处理
2022-07-20 15:03

回答 1 已采纳这个问题我以前也困扰过，研究半天发现结果其实特别简单，embedding 层就是一个查找表。这就是说，如果你有 10 个 token，也就是有 10 种 one-hot 编码，那么每一个 one-ho
文本数据为阿拉伯数字和运算符号怎么做embedding呢 nlp word2vec 语言模型
2023-03-30 10:43

回答 1 已采纳文章：深度学习中，embedding如何理解？中也许有你想要的答案，请看下吧
请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 21:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
Ollama利用嵌入模型实现RAG应用
2024-04-11 19:00

小龙在山东的博客 Ollama支持embedding models嵌入模型，从而支持RAG（retrieval augmented generation）应用，结合文本提示词，检索到文档或相关数据。嵌入模型是通过训练生成向量嵌入，这是一长串数字数组，代表文本序列的关联关系...
将FAQ问答基于django实现web界面 django nlp 自然语言处理
2022-06-21 16:31

回答 1 已采纳 django不会，flask稍微会一点，框架先放一边，你这个功能实现其实就是搭一个web server，提供一个问答接口，接受问题参数，返回答案数据，前端弄个网页，两个文本框，一个用来写问题，一个用来
embedding的原理 matlab python 深度学习
2022-08-14 21:34

回答 2 已采纳 embedding的原理你可以去搜cbow和skip-gram，说白了就是用两边的字或词预测中间的，或者用中间的字或词预测两边的。第一，每个文本，我们可以取字也可以取词，以字为例，先生成字典{"以":
如下该怎么解决tensorflow报错问题呢 keras python tensorflow
2023-04-18 11:09

回答 6 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：这个报错信息意味着在加载 SavedModel 时，无法找到与输入张量匹配的适当函数。每个已保存的函数都只接受特定的输入函数签名，并且当 Saved
使用LangChain+Ollama的时候怎么使用其他的embedding模型
2024-06-25 09:23

蛐蛐蛐的博客而我们平时用到的HuggingFace的embedding model都基本以SentenceTransformer形式提供，我测试了一下，embeddings.huggingface.HuggingFaceBgeEmbeddings这个类是可以使用的，embeddings.huggingface....
使用kashgari实现BERT+Bilstm命名实体识别，在保存模型时报错！！！求助！！！ python tensorflow 神经网络自然语言处理
2021-03-01 19:29

回答 5 已采纳你好。这个错误需要进入源码进行一下修正。我已经私信你了，请看一下。需要在D:\dev\anaconda\lib\site-packages\kashgari\tasks\abs_task_mode
tensorflow 怎么进行变长序列的embedding？ tensorflow 数据挖掘深度学习神经网络自然语言处理
2020-09-11 16:23

回答 1 已采纳 https://blog.csdn.net/qq_27825451/article/details/88991529
处理程序中的Golang抽象，以避免代码重复
2016-07-14 12:15

回答 1 已采纳 You can't because Go does not have inheritance. Let me repeat: Go does not have inheritance, so p
【LLM-RAG】知识库问答 | 检索 | embedding
2024-01-01 12:12

山顶夕景的博客 RAG流程（写作论文中的background：公式设定、emb、召回内容、召回基准）（工作中的思路《A Survey on Retrieval-Augmented Text Generation》该工作旨在对检索增强文本生成进行研究。主要核心的点如下：1、...
word embedding区分大小写吗，尤其是首字母 actionscript c语言 typescript
2023-03-09 21:07

回答 1 已采纳该回答引用ChatGPT 在 Word embedding 中，通常会将单词的大小写视为不同的单词，并分别对其进行编码，即大小写形式不同的单词会被视为不同的词汇，这是因为同一个单词的不同大小写形式可
RAG现成方案及Ollama + Qwen2.5 +AnythingLLM实现本地知识库
2024-07-26 14:34

长庚~Richarlie的博客 RAG，即检索增强生成（Retrieval-Augmented Generation），是一种先进的自然语言处理技术架构，它旨在克服传统大型语言模型（LLMs）在处理开放域问题时的信息容量限制和时效性不足。RAG的核心机制融合了信息检索系统...
RAG：如何从0到1搭建一个RAG应用
2024-08-06 11:32

少喝冰美式的博客检索增强生成）是一种强大的工具，整合了从庞大知识库中检索到的相关信息，并以此为基础，指导大型语言模型生成更为精准的答案，从而显著提升了回答的准确性与深度。2020 年，Meta AI 研究人员提出了RAG的方法，用于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月1日

悬赏问题

¥15 有没有整苹果智能分拣线上图像数据
¥20 有没有人会这个东西的
¥15 cfx考虑调整“enforce system memory limit”参数的设置
¥30 航迹分离，航迹增强，误差分析
¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败
¥15 用Ros中的Topic通讯方式控制小乌龟的速度，走矩形；编写订阅器代码
¥15 LLM accuracy检测
¥15 pycharm添加远程解释器报错
¥15 如何让子窗口鼠标滚动独立，不要传递消息给主窗口
¥15 如何能达到用ping0.cc检测成这样？如图

Ollama调用Embedding models实现RAG应用代码报错

7条回答 默认 最新

问题事件

悬赏问题

7条回答默认最新