大模型与rag检索增强技术的问题

使用大语言模型结合领域标准文档构建本地知识库时，问答时只能作用于构建好的问答数据集吗？能否回答非数据集的问题？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-21 23:13
关注
引自免费微信小程序：皆我百晓生

在使用大语言模型（如通义千问这样的模型）结合领域标准文档构建本地知识库时，确实可以将这些模型用于多种用途，包括但不限于对已构建的问答数据集进行查询。实际上，这些模型的一个关键优势就是它们能够泛化到未见过的问题，即它们可以尝试回答那些不在训练数据集中的问题。

要实现这一目标，你需要首先将领域标准文档输入到预训练的语言模型中，然后通过微调让模型学习这些领域的特定知识。一旦完成微调，你就可以使用这个定制化的模型来回答各种相关领域的问题，无论是数据集中存在的还是新的、未曾遇见的问题。

以下是大致的步骤：

数据准备：收集并整理领域相关的标准文档，将其转化为文本格式。
微调模型：使用这些文本作为输入，对预训练的大规模语言模型进行微调。这通常涉及设置一个任务，例如回答封闭式问题，或者根据给定的上下文生成相应的答案。
评估和调整：测试微调后的模型在一些验证数据上的性能，并根据结果进行必要的参数调整。
应用：使用微调后的模型来回答用户提出的新问题，无论这些问题是否出现在原始数据集中。

这里是一个简单的Python示例，展示了如何使用Hugging Face的Transformers库加载预训练模型并对其进行微调。请注意，实际操作可能需要大量的计算资源和时间，而且对于大规模的微调，你可能需要在GPU上运行。

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, Seq2SeqTrainingArguments, Seq2SeqTrainer # 选择预训练模型，例如T5 model_name = "t5-base" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForSeq2SeqLM.from_pretrained(model_name) # 假设你已经有了训练数据，存储在一个列表中，每个元素是dict，包含"context"和"response" train_data = [ {"context": ..., "response": ...}, # ... ] # 准备数据集 dataset = MyDataset(train_data, tokenizer=tokenizer) # 设置训练参数 training_args = Seq2SeqTrainingArguments( output_dir='./results', num_train_epochs=3, per_device_train_batch_size=8, save_steps=10_000, save_total_limit=2, ) # 创建Trainer trainer = Seq2SeqTrainer( model=model, args=training_args, train_dataset=dataset, ) # 开始微调 trainer.train() # 微调完成后，你可以保存模型 trainer.save_model('./my_finetuned_model') # 使用微调后的模型回答新问题 def answer_question(question): input_text = question + " </s> " # 添加</s>表示结束符 inputs = tokenizer.encode(input_text, return_tensors="pt") outputs = model.generate(inputs, max_length=50, do_sample=True) response = tokenizer.decode(outputs[0]) return response new_question = "What is the capital of France?" answer = answer_question(new_question) print(answer)

这段代码只是一个基础示例，实际应用中可能需要对数据进行更详细的预处理，比如添加适当的开始和结束标记，以及调整训练参数以适应你的具体需求。此外，注意这只是一个简化的流程，实际的微调过程可能会更复杂，包括更精细的数据清洗、多轮迭代和模型选择等。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

The Two Note Rag
2017-10-30 13:42

回答 1 已采纳 http://blog.csdn.net/u012925008/article/details/44230635
Codeigniter和数据表搜索过滤器列问题 php
2018-09-21 20:45

回答 2 已采纳 Remove serverSide on load_data function. <script type="text/javascript" language="javascrip
acm poj1001 编译通过网上能找到的数据都试了一直没问题但一提交就wrong answer
2017-05-24 06:51

回答 1 已采纳这道题还是用java做吧。。。。 import java.util.*; import java.math.*; public class M
一文读懂：大模型RAG（检索增强生成）
2024-04-11 10:25

程序员笑武的博客通过使用语言模型生成多个查询并对搜索结果进行重新排序，RAG融合可以呈现更丰富多样的内容，并提供了一个额外的层次，用于调整应用。此外，RAG融合还可以实现自动纠正、节省成本以及增加内容多样性。但是，需要注意...
旧版unity动画系统button按钮如何控制动画的开门和关门的同时控制灯的颜色的变化 ui unity 动画
2022-10-15 23:52

回答 2 已采纳看是需要用几个button控制了，需求不一样的话编写的思路也不一样。如果用一个按钮控制的话，就可以在animation界面设置bool变量用于控制开门或者关门的动画逻辑，然后编写button按键代码的
如何匹配字符串中特定范围之间的特定字符？ php
2016-03-17 00:34

回答 4 已采纳 With preg_replace and the \G anchor: echo preg_replace('~(?:\G(?!\A)|\bstart\b)[^e]*\K(?:\Be|e(?!
5分搞懂大模型 - RAG（检索、增强、生成）
2024-09-01 08:00

健忘的派大星的博客 RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息，并将其作为提示（Prompt）输入给大型语言模型（LLMs），以...
《AI大模型应用》--唐诗三百首RAG检索增强生成.zip
2024-07-15 11:16

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...
《AI大模型应用》--从0-1系统性快速学习大模型检索增强技术RAG.zip
2024-07-15 11:16

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...
大模型的RAG(检索增强生成) ----大模型外挂
2024-04-19 10:58

陈洪伟的博客检索增强生成（RAG）是一个概念，也可以称为一种范式，它旨在为大语言模型（Large Language Model，LLM）提供额外的、来自外部知识源的信息。
人工智能-项目实践-信息检索-从0-1系统性快速学习大模型检索增强技术RAG
2024-02-29 17:08

在本项目实践中，我们将深入探讨“人工智能-项目实践-信息检索-从0-1系统性快速学习大模型检索增强技术RAG”。RAG，全称为Retrieval-Augmented Generation，是一种将检索技术与生成模型相结合的方法，用于提高信息...
《AI大模型应用》--文渊支持图文回答的RAG增强检索项目.zip
2024-07-15 11:16

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...
一文彻底搞懂rag大模型（检索、增强、生成）
2024-09-28 17:44

大模型扬叔的博客一文彻底搞懂rag大模型（检索、增强、生成）
【AI大模型教程】RAG检索增强生成
2024-09-02 15:51

大模型老猿的博客大型语言模型（LLM）会产生“幻觉”现象，检索增强生成（RAG）通过从外部知识库检索相关文档chunk并进行语义相似度计算，增强了LLM的功能，很大程度解决幻读。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月21日

悬赏问题

¥15 两台交换机分别是trunk接口和access接口为何无法通信，通信过程是如何？
¥15 C语言使用vscode编码错误
¥15 用KSV5转成本时，如何不生成那笔中间凭证
¥20 ensp怎么配置让PC1和PC2通讯上
¥50 有没有适合匹配类似图中的运动规律的图像处理算法
¥15 dnat基础问题,本机发出,别人返回的包,不能命中
¥15 请各位帮我看看是哪里出了问题
¥15 vs2019的js智能提示
¥15 关于#开发语言#的问题：FDTD建模问题图中代码没有报错，但是模型却变透明了
¥15 uniapp的h5项目写一个抽奖动画

大模型与rag检索增强技术的问题

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新