ERNIE大模型的系统记忆没有生效

ERNIE大模型的系统记忆为何没有生效？我已经更新了一些系统记忆，接着向ERNIE提问，但是很明显它的回答不是从我预设的系统记忆来的。
这是我的步骤：

我先获得了一个memory id，然后更新了一些记忆内容，并且接口返回成功。我有查询了这些记忆，返回的结果也跟我预设的一样。说明系统记忆创建成功了。

update_resp = resources.Memory.modify_system_memory(
    system_memory_id="sm-xxxxxxxxxxxqg",
    memories=[
        [
            {"role": "user", "content": "你叫什么?"},
            {"role": "system", "content": "你好，我叫小度!"},
        ],
        [
            {"role": "user", "content": "我喜欢的球类运动是乒乓球和篮球。不喜欢的球类是足球和网球"},
            {"role": "system", "content": "喜欢乒乓球的人一般都是很有耐心的人，喜欢篮球的人一般都是很有活力的人。"},
        ],
        [
            {"role": "user", "content": "除了球类，我还喜欢看电影和听音乐"},
            {"role": "system", "content": "看电影和听音乐是很好的消遣方式，你喜欢什么类型的电影和音乐呢？"},
        ],
    ],
)

我接下来向ERNIE模型提问，问题基本来自于预设的内容。这里的system_memory_id跟我前面创建时用的是同一个。

respChat = chat_comp.do(
    model="ERNIE-4.0-8K",
    messages=[{"role": "user", "content": "那我不喜欢什么球类运动?"}],
    system="你是一名生活助理，你要优先根据系统记忆来回答用户的问题",
    enable_system_memory=True,
    system_memory_id="sm-xxxxxxxxxxqg",
)

我先提问"我喜欢什么球类运动？" ，回复是“您喜欢篮球，您说过篮球是一项充满活力和激情的运动，您很享受在球场上奔跑和投篮的感觉。”
我接着问“那我不喜欢什么球类运动?”，回复是“根据我之前的了解，您不太喜欢橄榄球这项运动。”
基本上跟我预设的系统记忆完全不搭边。
这是怎么回事呢？

我研究这个玩意主要是为了做一个AI助理，帮助用户回答和生成一些信息，然后希望保存用户和系统的回答到记忆里，这样的话我不必每次对话请求都重复发送之前的聊天记录，系统也能够知道前面用户说了什么。可以节省token。不知道我对这个功能的理解对不对？还是说为了实现这样的功能，有没有别的做法？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

26条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-08-17 18:00
关注
获得0.30元问题酬金
以下回复引自免费微信小程序：皆我百晓生。如问题解决，还请采纳。如仍有疑问，请回复留言或私信博主，以便获得更精准的帮助。

要解决ERNIE大模型系统的记忆问题，我们需要先理解ERNIE的大模型是什么，它是一个超大规模的语言模型，并且在训练过程中需要大量的系统记忆来构建其知识结构。ERNIE的大模型使用了多个不同的序列和上下文环境作为输入，这些环境通常包含了大量事实、文本以及一些特定的情感信息，以帮助大模型学习如何理解和回应这些输入。

ERNIE的大模型通过多种方式获取到这个系统记忆：首先，它会使用外部训练数据来训练一个自注意力机制（SELF-ATTENTION NETWORK），这个网络可以将输入中的不同部分整合在一起形成一个整体。其次，它还会使用一些特殊的模型参数，比如正则化权重和偏置，来限制内部神经元之间的相互作用。此外，ERNIE还利用了强化学习的方法来优化模型的性能，例如通过调整参数来提高模型的学习率。

然而，ERNIE的大模型并没有直接提供关于系统记忆的详细信息。这可能是由于以下原因：

大模型的训练过程：ERNIE的大模型通常是在训练阶段使用大量的训练数据来构建其知识结构，而这些数据通常来自大量的自然语言处理任务。因此，即使ERNIE已经进行了大量的训练，系统记忆可能还没有被完全提取出来或被有效地应用到了实际的任务中。

系统记忆的来源：ERNIE的大模型通常使用外部的训练数据来进行训练，这些数据通常是基于特定任务或者任务集的。如果这些数据是随机生成的或者是由其他语言模型使用的，则这些数据并不包含系统记忆的信息。在这种情况下，ERNIE可能会无法直接获取到系统的记忆信息。

系统记忆的完整性：ERNIE的大模型在训练时可能会遇到过大的训练损失或者过高的内存消耗等问题，导致系统记忆的质量下降。在这种情况下，ERNIE可能会选择不存储或者不展示系统记忆的内容，从而减少对训练的影响。

为了解决这个问题，我们可以尝试以下几个方法：

增加额外的数据源：为了确保ERNIE的大模型能够从真实世界中学习，我们可以通过增加更多的训练数据，包括自然语言处理任务的实际场景和实体，来丰富系统的记忆库。

引入更复杂的模型结构：ERNIE的大模型通常使用的是深度学习框架，其中的一些组件可能包括注意力机制、上下文感知器等。如果我们想要让ERNIE的大模型能够从真实的环境中学习，那么我们需要设计出更加复杂和灵活的架构，以支持这种学习。

优化训练策略：ERNIE的大模型往往需要频繁地进行更新和调整，以适应新的训练任务和需求。如果我们试图只保存训练数据而不考虑新任务的需求，那么ERNIE的大模型可能会失去重要的经验反馈，进而影响其性能。

使用预训练模型：ERNIE的大模型可能已经预先得到了某些领域的知识，因此我们可以在现有的预训练模型上添加额外的知识点，以增强模型的记忆能力。

采用强化学习的方式：ERNIE的大模型可能会面临一些挑战，例如训练周期较长或者数据量过大。如果我们尝试采用强化学习的方式来优化模型的行为，例如通过奖励机制来激励模型更好地完成任务，那么ERNIE的大模型可能会得到改进。

总的来说，ERNIE的大模型需要一个平衡的过程，既要保持与真实世界的联系，也要考虑到训练资源的有限性。通过不断优化训练策略和引入更多的外部数据，我们可以逐步改善ERNIE的大模型系统的记忆效果。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

cannot import name 'get_installed_distributions' from 'pip._internal.utils.misc') python 人工智能有问必答自然语言处理
2022-02-21 13:20

回答 2 已采纳这是因为paddlehub与pip的版本不匹配造成的，尝试以下两种解决方法：一是降pip版本为21.3以下（pip21.3已经去除了该方法）二是升级paddlehubpip install --upg
pycharm运行代码出现“在 '__init__.pyi' 中找不到引用” pycharm python tensorflow
2022-05-25 20:36

回答 2 已采纳 contrib已经在Tensorflow2.x弃用了，要么换1.x的版本，要么改代码，具体还需要去查一下这个api在2.x版本变成什么了，麻烦的很，早转pytorch早轻松
这才是大模型价格战背后的真相
2024-06-05 21:14

莫尔索随笔的博客想必大家今天肯定被各家大模型厂商的降价新闻刷圈了，如果说 Meta Llama 3 的开源是国外大模型市场的搅局者，那 DeepSeek-V2 就是国内大模型市场的鲶鱼，但是价格战背后是大模型基础设施优化带来的物美价廉，还是...
大模型的 5 月：热闹的 30 天和鸿沟边缘
2024-05-30 14:00

冻感糕人~的博客这个 5 月，可能是 ChatGPT 发布至今大模型行业最热闹的时候：OpenAI、Google、微软、字节跳动、阿里巴巴等中美两国公司至少举办了 13 场与大模型相关的发布会，介绍了 10 多款新模型，拿出了一堆新产品。...
AI大模型价格战：最先被卷死的是谁？
2024-05-25 16:00

AI_小站的博客万万没想到，今年“618”竟然从AI大模型开始。短短几天内，腾讯、阿里、百度、科大讯飞等国产大模型纷纷降价，让我们提前感受到了朴实的“购物节”氛围。目前国产大模型降价情况汇总不过在好戏开场之前，我们先弄清...
初识langchain：LLM大模型+Langchain实战[qwen2.1、GLM-4]+Prompt工程
2024-07-22 09:35

AI大模型 lose and dream的博客模型编码：glm-4-0520、glm-4 、glm-4-air、glm-4-airx、 glm-4-flash，根据输入的自然语言指令完成多种语言类任务，推荐使用 SSE 或异步调用方式请求接口场景示例模型广场官网大模型开源 glm-4-9b 简单介绍GLM-4-9B...
初识langchain[1]：Langchain实战教学，利用qwen2.1与GLM-4大模型构建智能解决方案[含Agent、tavily面向AI搜索]
2024-07-16 10:25

汀、人工智能的博客初识langchain[1]：Langchain实战教学，利用qwen2.1与GLM-4大模型构建智能解决方案[含Agent]
【业界】百度NLP十年技术积累，最新发布5款产品，公布两大计划
2020-08-28 20:30

zenRRan的博客来自：python遇见NLP 2020年8月25日，百度语言与知识技术峰会于上午10点线上举行。由百度 CTO王海峰主持，为我们介绍了百度NLP十年来的发展，并发布产品、数据、算力...
清华2019最新AI发展报告出炉！400页干货，13大领域一文看懂
2019-12-16 19:24

喜欢打酱油的老鸟的博客目前主要使用图像深度网络作为视频的特征提取器，利用多模态特征融合模型，并利用记忆网络的推理能力，实现对事件的识别和推理认知。当前研究起源于视频的识别和检测，其方法并未充分考虑事件数据的复杂和多样性。...
AI日报｜微软推出Copilot+PC，通义主模型大幅降价，文心两大模型全面免费...
2024-05-22 10:32

可信AI进展的博客 “可信 AI 进展 “ 公众号致力于最新可信人工智能技术的传播和开源技术的培育，覆盖大规模图学习，因果推理，知识图谱，大模型等技术领域，欢迎扫码关注，解锁更多 AI 资讯～在OpenAI公开展示了新产品并收到了约翰逊...
PaddleNLP教程文档
2023-01-05 14:19

神洛华的博客 ids : {}".format(segment_ids)) # 此时即可输入ERNIE模型中得到相应输出 sequence_output, pooled_output = ernie_model(input_ids, segment_ids) print("Token wise output: {}, Pooled output: {}".format...
工作一年时期的土豆总结——复杂度和困难度
2022-03-20 17:42

FesianXu的博客以百度的ERNIE [10,11]为例，在大部分场景中对模型结构的改动是很微小的，大多集中在：模型改动目的举例嵌入特征维度模型嵌入特征的维度，大部分时候都是需要结合模型部署的性能和资源消耗（比如推理时间，吞吐...
2020法研杯比赛阅读理解任务冠军参赛总结
2020-10-20 21:13

zenRRan的博客作者 | 虹猫（AINLP）学校 |中南大学研究方向 | 自然语言处理2020法研杯阅读理解竞赛上个月结束了，我们团队在最终阶段有幸获得了第一名的成绩，去年我也参加了这次比赛，过了一年...
langChain学习笔记（待续）
2024-02-27 23:46

Generalzy的博客举一个小例子，我以前特别喜欢玩一款叫作《梦幻西游》的游戏。...其后台肯定有玩家的各种数据，例如游戏时长、充值金额、战斗力等，通过这些数据就可以建立一个模型，用来预测哪些用户最有可能返回来接着玩（充钱）！
5. GLM4入门介绍
2024-03-21 15:08

Andy_shenzl的博客 system role用于身份设定不过，值得一提的是，user和assistant的这种提问方式尽管足够清晰，但往往形式上不够丰富，例如在实践中人们发现，给聊天机器人进行一个身份设置，其实是非常有效的引导模型创作我们想要的...
大模型学习应用 2：快速上手大模型基于langchain实现RAG检索应用
2024-08-20 16:41

大地之灯的博客快速上手大模型基于langchain实现RAG检索应用 - 项目作业。
基于近半年Twitter与Github趋势分析_12大分类500+ChatGPT最新开源GitHub存储库（涵盖ChatGPT开发全框架、全编程语言及教程）——每周更新
2023-05-19 11:15

小胡说人工智能的博客随着OpenAI的ChatGPT的爆火，短短数月，围绕着ChatGPT的各种应用层出不穷...这些资源包括不同编程语言代码实现、nlp知识、教程、开发框架、模型微调等丰富多样的内容，它们将有助于你更加深入地理解并运用ChatGPT技术。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月17日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

ERNIE大模型的系统记忆没有生效

26条回答 默认 最新

问题事件

悬赏问题

26条回答默认最新