LLM/ RAG 处理JSON数据提问

背景介绍：有50000个JSON数据，每一个JSON都对应了一位学生的信息，包括学生姓名，学生身高，学生体重。我需要利用这些JSON数据，利用LLM帮助查找查找出一些信息。例如，teacher提问：请列出50000学生中，BMI都处于合格范围内的学生信息。在这个问题中，我需要建立LLM模型，书写prompt，回答teacher所有可能的问题。

prompt的书写大致如下：f"学生信息JSON数据如下：{student_information_json}. 请你根据提供的学生信息，帮助一位teacher回答下列问题：{teacher_problem}"。

提问：在这个程序中，我发现LLM处理的效率很低，可能是JSON数据太复杂了原因吗？有什么办法可以让LLM高效完成这个任务吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2025-02-05 12:37
关注
以下回复引自免费微信小程序：皆我百晓生。如问题解决，还请采纳。如仍有疑问，请回复留言或私信博主，以便获得更精准的帮助。

在PYTHON中，我们可以使用JSON库来处理JSON数据。以下是一个简单的例子，展示了如何从JSON文件中读取数据，并使用LLM（自然语言处理模型）来找到学生的名字、身高和体重的相关信息。

首先，我们需要导入所需的库：

IMPORT JSON FROM GENSIM.MODELS IMPORT KEYEDVECTORS

然后，创建一个字典来存储学生的相关信息：

STUDENT_INFO = { '张三': {'NAME': '张三', 'HEIGHT': 172.3, 'WEIGHT': 68}, '李四': {'NAME': '李四', 'HEIGHT': 168.4, 'WEIGHT': 70}, # 更多的姓名和身高/体重信息... }

接下来，我们定义一个函数来查找和返回学生的名字、身高和体重的相关信息：

DEF GET_STUDENT_DETAILS(JSON_DATA): RESULT = {} FOR KEY IN STUDENT_INFO: IF ISINSTANCE(STUDENT_INFO[KEY], DICT) AND 'NAME' IN STUDENT_INFO[KEY]: NAME = STUDENT_INFO[KEY]['NAME'] HEIGHT = STUDENT_INFO[KEY]['HEIGHT'] WEIGHT = STUDENT_INFO[KEY]['WEIGHT'] RESULT[NAME] = {'HEIGHT': HEIGHT, 'WEIGHT': WEIGHT} RETURN RESULT # 测试函数 TEST_JSON = '{"STUDENTS": [{"NAME":"张三","HEIGHT":172.3,"WEIGHT":68},{"NAME":"李四","HEIGHT":168.4,"WEIGHT":70}]}' PRINT(GET_STUDENT_DETAILS(TEST_JSON))

这段代码将打印出一个字典，其中包含每个学生的名字、身高和体重。你可以根据需要添加更多的学生信息到这个字典中。

请注意，这只是一个基本的例子。在实际应用中，你可能还需要考虑数据清洗、异常值检测、数据预处理等步骤。此外，你需要选择合适的LLM模型（如GPT-3、ELEUTHERAI/GIGAWORD等），并确保它们能够正确理解你的数据格式。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LLM RAG检索生成的深度解析：理解其工作原理与应用
2024-08-21 21:50

大模型入门教程的博客 2024年随着大模型进一步增强升级，越来越多的大模型应用落地，经过初期的探索和研究，目前业界逐渐收敛聚聚于两个主要的应用方向：RAG和Agents。今天我们就来先聊聊这个RAG～RAG：全称Retrieval-Augmented ...
关于RAG（检索增强生成）LLM的最佳实践
2024-12-27 11:54

Python程序员罗宾的博客微调大多数基于RAG（检索增强生成）的应用程序都假定LLM（大型语言模型）无法更新，因此需要使用RAG架构来丰富数据。然而，在某些情况下，对LLM模型进行微调是非常合适的。这尤其适用于教授特定于模型的行业术语或...
大语言模型(LLM)入门学习路线图
2024-02-28 17:36

Kk-Quiana的博客 Github项目上有一个，它涵盖了大语言模型基础学习，LLM前沿算法和架构学习，以及如何将大语言模型进行工程化，是一个很好的帮助初学者入门大语言模型的路线图。
llm与RAG的学习与优化
2025-09-08 11:27

码农Q！的博客同时提供了RAG系统的开发流程和调优方法，涵盖预处理、检索和后处理三个核心环节，涉及分块策略、元数据过滤、查询转换和重排序等技术手段。最后作者分享了对大模型技术快速发展的观察和实际开发心得。
【LLM大模型】落地RAG系列：RAG入门及RAG面临的挑战和解决方案！！
2024-07-31 16:14

LLM教程的博客 2023 年以来，RAG 已成为基于大模型的人工智能系统中应用最为广泛的架构之一。因此对 RAG 应用的性能、检索效率、准确性的研究成为核心问题。
大语言模型实战（九）——从零到一：搭建基于 MCP 的 RAG 系统完整教程
2025-12-31 00:27

小陈phd的博客 RAG 是检索（Retrieval）：从知识库中查找相关的信息生成（Generation）：使用 LLM 根据检索的信息生成回答✅ 可以处理模型未见过的最新信息✅ 回答基于真实数据，降低幻觉风险✅ 支持添加自定义知识库✅ 更精准和...
为什么在 RAG 中，文档解析为 JSON 优于 Markdown？
2025-01-10 14:26

alicia2322的博客本文将分享作者和团队在实践中对 RAG 场景的深入探索和体会，阐述为什么将文档解析为 JSON 格式相比 Markdown 更加适合。
【RAG】表格场景RAG怎么做？TableRAG：一种增强大规模表格理解框架
2024-10-12 19:44

余俊晖的博客前面很多期介绍了密集文档场景的RAG方法，今天来看看大量表格场景的RAG怎么做的。现有结合大模型的方法通常需要将整个表格作为输入，这会导致一些挑战，比如位置偏差、上下文长度限制等，尤其是在处理大型表格时。...
Chat /RAG / Agent选型指南：场景对照表、Checklist、Python骨架
2025-12-29 14:00

147AI的博客陷阱本文针对大模型项目落地中的常见误区，提供了一套实用决策框架：选型原则： Chat：适用于生成/解释类任务（成本最低） RAG：需基于可追溯资料回答时使用 Agent：仅限需要执行动作的流程场景关键工具：四象限...
【LLM大模型】基于LangChain构建RAG应用
2024-07-09 11:28

LLM.的博客【LLM大模型】基于LangChain构建RAG应用
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月5日

LLM/ RAG 处理JSON数据提问

3条回答 默认 最新

问题事件

3条回答默认最新