智能体记忆架构如何设计？从Lilian Weng的智能体理论到百度地图的工程实践

在关注智能体发展过程中，我发现很多基于大模型（LLM）的系统在实际使用时仍然存在“记不住用户”的问题，比如无法长期记忆用户偏好、行为习惯或历史交互内容，这与我们期望的“千人千面”智能体验还有一定差距。因此我开始关注智能体记忆架构是如何设计的，以及理论与工程之间如何落地。
我目前主要是在体验百度地图智能副驾、小度想想等智能体产品，同时也参考了一些关于大模型Agent架构的资料，包括Lilian Weng提出的智能体体系（LLM+感知+决策+记忆）等相关内容。
在尝试理解过程中，我了解过一些常见方案，比如通过Prompt拼接实现短期记忆、通过向量数据库实现长期记忆检索等，但对于完整的工程架构设计（例如API层、操作层、存储层如何协同、记忆写入与遗忘机制如何设计等）仍然缺乏系统认知。
因此我想进一步了解，从Lilian Weng的智能体理论出发，到百度地图在实际产品中的工程实践，是如何设计一套可扩展、可落地的智能体记忆架构，从而支撑真实用户场景下的个性化服务能力的。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2026-04-17 16:49
关注
下午好🌅🌅🌅
本答案参考通义千问

智能体记忆架构的设计是构建个性化、持续交互的AI系统的关键环节，尤其在像百度地图这样的实际产品中，需要兼顾长期记忆、短期记忆、上下文感知、遗忘机制、可扩展性等多个维度。从 Lilian Weng 的智能体理论（LLM + 感知 + 决策 + 记忆）出发，结合 百度地图等实际产品的工程实践，我们可以逐步拆解出一套完整的智能体记忆架构设计方法。

一、理解智能体记忆的核心概念

1.1 记忆类型分类

短期记忆（Short-term Memory）：用于当前会话或任务中的上下文信息。
长期记忆（Long-term Memory）：用于存储用户偏好、行为习惯、历史交互等持久数据。
工作记忆（Working Memory）：用于推理和决策过程中的临时状态。

1.2 记忆的目标

个性化服务：根据用户历史行为提供定制化体验。
上下文感知：在多轮对话中保持一致性。
高效检索与更新：支持快速读取和写入。

二、Lilian Weng 的智能体理论框架

Lilian Weng 提出了一个基于大模型的智能体体系结构，其中“记忆模块”是核心组成部分之一。她的理论强调：

记忆模块应具备：
存储能力：记录用户行为、偏好、环境状态等。
检索能力：根据当前任务快速提取相关记忆。
更新机制：根据新信息动态更新记忆。
遗忘机制：避免记忆过载，提升效率。

三、百度地图的工程实践与智能体记忆架构设计

百度地图在智能副驾、小度想想等产品中，采用了一套分层、模块化、可扩展的记忆架构，以下是其典型设计思路：

3.1 架构分层结构

| 层级 | 功能描述 | |------|----------| | API层 | 提供对外接口，如用户身份识别、记忆查询、记忆更新等。 | | 操作层 | 负责处理业务逻辑，如用户行为分析、记忆匹配、决策建议等。 | | 存储层 | 存储用户长期记忆（如向量数据库、关系型数据库等）。 | | 记忆引擎 | 实现记忆的读取、写入、更新、遗忘等核心逻辑。 |

3.2 记忆写入与遗忘机制

写入机制：

用户行为日志（如搜索、点击、导航路径）被实时采集并编码为向量。
使用向量数据库（如 Faiss、Milvus）进行存储。
需要对用户身份进行绑定，确保记忆的用户隔离性。

遗忘机制：

基于时间衰减（Time Decay）：旧记忆权重逐渐降低。
基于重要性评估（Importance Score）：根据用户行为频率、场景重要性决定是否保留。
基于空间/时间范围限制（如只保留最近7天的导航记录）。

3.3 短期记忆与长期记忆协同

短期记忆：

使用 Prompt拼接 或 缓存机制，在单次会话中维持上下文。
如：在一次对话中，系统记住用户上一次提到的目的地，无需重复询问。

长期记忆：

通过 向量数据库 存储用户历史行为。
在后续对话中，通过相似度匹配检索相关记忆，实现个性化推荐。

四、完整智能体记忆架构设计方案（分步）

以下是一个从理论到工程落地的完整智能体记忆架构设计方案：

4.1 系统架构设计

API 层

提供 RESTful API 接口，用于外部调用记忆服务。
包括：GET /memory, POST /memory, DELETE /memory 等。
支持用户身份认证（如 Token、Session ID）。

操作层

实现记忆的逻辑处理，包括：
记忆匹配（根据当前上下文检索相关记忆）。
记忆更新（根据用户行为更新记忆库）。
记忆过滤（根据遗忘策略剔除不相关数据）。

存储层

使用混合存储方式：
短期记忆：使用 Redis 缓存。
长期记忆：使用向量数据库（如 Milvus）+ 关系型数据库（如 MySQL）。

每条记忆包含：
用户 ID
时间戳
向量表示
权重值（用于遗忘机制）

记忆引擎

核心组件，负责：
记忆的读取、写入、更新、删除。
实现遗忘策略（如基于时间衰减或重要性评分）。
支持多模态数据（文本、图像、位置等）。

4.2 记忆写入流程

用户行为触发：如用户输入搜索词、选择路线、点赞等。
行为编码：将行为转换为向量（可使用 BERT、Sentence-BERT、自定义模型）。
写入记忆库：将编码后的向量与用户 ID、时间戳一起存储。
更新权重：根据行为重要性调整该条记忆的权重。

示例代码（Python）：

import numpy as np from milvus import connections, Collection # 连接 Milvus 数据库 connections.connect(host='localhost', port='19530') collection = Collection("user_memory") collection.load() # 示例：写入用户行为 user_id = "u123" behavior_vector = np.random.rand(768) # 假设是 BERT 向量 timestamp = int(time.time()) weight = 1.0 # 初始权重 # 插入到 Milvus collection.insert( data=[behavior_vector, [user_id], [timestamp], [weight]] )

4.3 记忆遗忘机制

时间衰减公式： $$ \text{weight} = \text{initial_weight} \times e^{-\lambda \cdot (t - t_0)} $$ 其中：

$ t $ 是当前时间
$ t_0 $ 是记忆创建时间
$ \lambda $ 是衰减系数

重要性评分：

根据用户行为频率、场景优先级（如常去地点、高频搜索词）计算得分。
得分低的记录会被标记为“可遗忘”。

定期清理：

定时执行内存清理任务，移除权重低于阈值的记忆条目。

五、工程实践中的关键点

5.1 可扩展性

采用微服务架构，支持水平扩展。
使用分布式向量数据库（如 Milvus、Pinecone）处理大规模数据。

5.2 用户隐私与安全

所有用户数据需加密存储。
记忆访问需经过权限控制，防止数据泄露。

5.3 性能优化

使用缓存（如 Redis）加速短期记忆读取。
对长期记忆进行索引优化，提升检索效率。

六、总结

| 项目 | 内容 | |------|------| | 核心目标 | 实现个性化、持续交互的智能体验 | | 记忆类型 | 短期记忆 + 长期记忆 + 工作记忆 | | 架构分层 | API 层、操作层、存储层、记忆引擎 | | 关键机制 | 写入机制、遗忘机制、检索机制 | | 技术选型 | 向量数据库（Milvus）、Redis、BERT 等 | | 工程重点 | 可扩展性、安全性、性能优化 |

如果你希望进一步了解某一层的具体实现，比如 如何设计记忆引擎的遗忘算法 或 如何使用 Milvus 实现向量检索，我可以继续为你展开讲解。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LLM 驱动的自主智能体：原理、组件与实践（基于 Lilian Weng 论文解读）
2025-09-19 08:23

博一波的博客摘要：大语言模型（LLM）自主智能体通过结合规划、记忆和工具使用三大组件，将LLM从文本生成器升级为问题解决者。规划组件负责任务拆解和反思优化；记忆组件实现短期和长期经验存储；工具组件扩展LLM能力边界。典型...
中文翻译Are Deep Neural Networks Dramatically Overfitted?-Lilian Weng
2025-10-31 09:36

内容概要：文章探讨了深度神经...阅读建议：建议结合文中的实验复现代码深入理解各现象背后的机制，重点关注内在维度测量、层鲁棒性测试和彩票假设的实现过程，同时对比传统理论与现代深度学习实践之间的矛盾与统一。
中文翻译How to Explain the Prediction of a Machine Learning Model?-Lilian Weng
2025-10-10 09:00

内容概要：本文系统探讨了机器学习模型预测结果...阅读建议：此资源侧重理论与方法综述，建议结合具体模型和数据实践文中提到的解释技术，尤其应重视局部解释与全局解释的适用边界，并关注模型校准对解释有效性的影响。
浅析智能体开发（第二部分）：智能体设计模式和软件架构
2024-05-22 23:32

vastgrassland的博客我们从多个维度对AI Native智能体与传统软件进行了比较和分析，涉及开发语言、软件架构、设计模式和编程模式等多个方面。图：本文梳理的智能体软件设计模式和发展脉络本文梳理智能体软件设计模式和...
收藏备用！智能体（Agent）从入门到核心架构全解析（大模型学习必备）
2025-12-29 11:29

大模型研究院的博客 MCP（Model Context Protocol）是Anthropic在2024年11月提出的开源标准与框架，旨在标准化AI...对于小白来说，学习路径可分为三步：基础认知：理解智能体与传统工作流的区别，掌握“LLM+规划+记忆+工具”的核心架构；
从大模型到 Agent：具备记忆与规划能力的智能体是如何工作的
2025-12-31 13:38

张彦峰ZYF的博客本文从工程系统与认知结构的视角，系统梳理了大模型 Agent 的核心概念与关键能力演进路径。文章首先明确了 Agent 相较于传统大模型在交互方式与系统形态上的本质差异，随后重点分析了 Agent 的记忆机制（短期记忆与...
大模型智能体架构实战：从单Agent到多Agent系统，一篇搞定，值得收藏！
2025-09-03 11:52

冻感糕人~的博客大模型智能体架构实战：从单Agent到多Agent系统，一篇搞定，值得收藏！
Lilian Weng 最新万字长文：揭秘大模型「思考」的奥秘！从 CoT 到 Aha Moment，未来智能呼之欲出
2025-05-19 09:50

具身机器人曾小健的博客原创段小草2025年05月18日 01:00河南AI 圈又出重磅深度长文！知名 AI 研究员、前 OpenAI 应用AI 研究负责人 Lilian Weng，刚刚在她的博客 Lil'Log 上发表...虽然更新不多，但她关于 Prompt 工程、智能体、大模型幻觉、
中文翻译Attention? Attention!-Lilian Weng
2025-10-23 14:18

内容概要：本文系统介绍了深度学习中的注意力机制，从其起源、核心概念到多种变体和应用场景。文章首先指出传统Seq2Seq模型因固定长度上下文向量难以处理长序列的问题，进而引出注意力机制的提出以建立输入与输出间...
AI智能体(Agent)技术解析：从理论到实践的大模型应用！
2025-12-24 16:28

智泊AI大模型学习教程的博客文章全面介绍了AI智能体(Agent)的概念、架构、核心组件及实践框架。智能体由大语言模型(LLM)、规划、记忆和工具使用四大模块构成，具备自主决策能力，可动态处理复杂任务。文章详细分析了ReAct、Reflexion等主流框架...
阿里云服务领域Agent智能体：从概念到落地的思考、设计与实践
2024-08-09 22:14

Python程序员罗宾的博客本文讲述了作者团队在阿里云的服务领域Agent是如何设计与实践的，以及到目前为止的一些阶段性成果，作者做出了总结和整理。一、背景以ChatGPT引领的大模型在2022年底开创了新的智能能力和对话交互形式，其中基于大...
AI智能体越用越聪明的关键：大模型记忆系统架构详解！
2025-12-12 11:26

智泊AI大模型学习教程的博客文章介绍了AI智能体的核心架构，包括LLM及记忆、规划和工具使用三大模块，其中记忆系统是让智能体越用越聪明的关键。详细介绍了MemMachine开源AI记忆库，支持短期、长期和个性化内存类型，通过关系型数据库和图...
【AI学习】Lilian Weng：What are Diffusion Models?
2024-09-25 22:57

bylander的博客 Lilian Weng博客《What are Diffusion Models?》
【必收藏】AI智能体架构详解：从大模型到行动助手的完整实现指南
2025-12-24 10:59

deepseek大模型的博客文章系统介绍了AI智能体的架构与发展，指出智能体=大语言模型(LLM)+规划能力+记忆+工具使用。与传统工作流不同，智能体具备自主性和动态决策能力。深入探讨了三大核心组件：规划能力(任务分解、思维链、自我反思)、...
智能体（Agent）—— 从工具调用到自主任务执行
2026-03-25 09:04

小小冒险家2022的博客好的角色定义role="数据分析专家",goal="从数据中提取有价值的洞察",你是一位拥有10年经验的数据科学家，擅长数据清洗、统计分析和可视化。你总是以数据为依据，提供客观的分析结果。""",
好用的ai agent智能体有哪些？这5个AI不容错过【良心干货】
2025-03-19 16:13

l1m0_的博客 AI人工智能发展到现在，越来越多的迹象表明，人们关注的焦点逐渐从底层的LLM模型转移到上边的应用层，最直观的体现，业内各个团队从卷模型开始转向卷ai agent，更注重LLM大模型最终交付给用户的成果。如果把LLM大...
从“语言巨人”到“行动能手”：AI浪潮下的终极答案？——大模型与智能体深度解析
2025-08-04 21:22

陈敬雷-充电了么-CEO兼CTO的博客《GPT多模态大模型与AI Agent智能体》深度解析了AI技术从"语言巨人"到"行动能手"的演进。文章对比了大模型（LLM）和智能体（Agent）的本质差异：大模型擅长语言理解与生成，但缺乏记忆和行动...
测试工程师如何理解和使用Agent智能体
2025-06-06 15:44

爱吃香菜的博客随着技术的不断进步，AI智能体将成为测试工程师的强大助手，帮助他们...测试工程师不必担心被智能体取代，而是应该积极学习如何与智能体协同工作，将重复性工作交给智能体，自己则专注于更具创造性和战略性的测试工作。
做Agent能够给业务带来什么价值？为什么一定要做Agent智能体？
2025-04-22 15:20

智泊AI—大模型小王的博客作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”...不过呢，在进行Agent能力落地、推广的过程中，我经常被问到一个问题：为什么一定要做Agent智能体？或者换句话说，做Agent能够给业务带来什么价值？
为什么一定要做Agent智能体？大模型智能体的五大优势与挑战分析
2025-09-19 18:12

AI大模型-海文的博客最近一直在从事Agent智能体相关的工作，主要是聚焦在阿里云客户服务领域，我之前写过的一篇Agent落地文章《阿里云服务领域Agent智能体：从概念到落地的思考、设计与实践》很荣幸受到了大家的欢迎，说明大家对Agent...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月17日

智能体记忆架构如何设计？从Lilian Weng的智能体理论到百度地图的工程实践

5条回答 默认 最新

一、理解智能体记忆的核心概念

1.1 记忆类型分类

1.2 记忆的目标

二、Lilian Weng 的智能体理论框架

三、百度地图的工程实践与智能体记忆架构设计

3.1 架构分层结构

3.2 记忆写入与遗忘机制

3.3 短期记忆与长期记忆协同

四、完整智能体记忆架构设计方案（分步）

4.1 系统架构设计

4.2 记忆写入流程

4.3 记忆遗忘机制

五、工程实践中的关键点

5.1 可扩展性

5.2 用户隐私与安全

5.3 性能优化

六、总结

问题事件

5条回答默认最新