大模型的长期且动态的记忆能力出路在哪里？Google提出的Titans会是答案吗？

起因

年初，Google提出了新架构Titans，是一种神经长期记忆模块，可以在测试时也学习记忆，而且还可以实现选择性记忆、动态更新，在各个任务上超过了transformer等模型，听起来是十分的美好。

这个研究一下把题主的思路拉回好多年前第一次接触深度学习，很激动的认为会有一种神经网络结构，会像是海马体和大脑皮层一样，能在训练和推理过程中不断的形成新记忆，不过由于当时深度神经网络的发展还没到现在那么强，单单依靠lstm这些简单的网络，难以完成复杂任务，这个想法在后续的学习中也就不了了之。

回到现在，谷歌提出的这个titans，题主在网上搜了一圈后，发现并未开源，只有非官方的几个实现。同时题主也并未感受到有技术狂欢，不禁对这项研究产生了些许怀疑。

思考

但不论这个研究后续会进展到什么程度，它也还是激发了一点题主对大模型记忆能力的思考：

前两年向量知识库火爆，现在也已经是rag的通用技术之一，向量检索这件事本身就有极大的价值。如果说大模型的本质就是向量计算，那么是不是可以把大模型和向量知识库结合起来，以向量为隐式的记忆，为大模型提供长期且动态的记忆能力呢？

这里指的并不是大模型输出后的结果，转向量，利用向量知识库进行模糊搜索。而是通过设计大模型中的某一模块或隐藏层，使其输出的向量能被用于向量知识库的操作，实现对向量的存储和检索。通过检索得出来的向量，或者说记忆，可以作为后续模块的输入。

通过这种内嵌的“原生”的记忆，形成新的模型框架，大模型是否就能在训练以及推理的过程中，利用外置的记忆模块完成自己的隐式操作，实现记忆的长期存储与动态更新呢？

希望各位能多多指点，大家一起交流想法。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-04-30 15:38
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

大模型的长期且动态的记忆能力出路在哪里？Google提出的Titans会是答案吗？

Titans 是 Google 提出的一个神经长期记忆模块，旨在解决大模型的长期记忆问题。Titans 可以在测试时也学习记忆，并且可以实现选择性记忆。这个架构的主要特点是，它使用了一个专门的记忆模块来存储和更新记忆，而不是像传统的神经网络那样使用全连接层。

Titans 的长期记忆能力来自于以下几个方面：

Memory-augmented neural networks：Titans 使用了一个专门的记忆模块来存储和更新记忆，这个模块可以在训练和测试时都被访问和更新。
Recurrent neural networks：Titans 使用了循环神经网络来实现记忆的更新和访问。
Attention mechanism：Titans 使用了注意力机制来选择性地访问和更新记忆。

Titans 的长期记忆能力可以解决一些常见的问题，例如：

Long-term dependency：Titans 可以解决长期依赖的问题，例如在语言模型中解决长期依赖关系。
Selective memory：Titans 可以实现选择性记忆，例如在图像识别中选择性地记忆某些特征。

总的来说，Titans 是一个有前途的架构，可以解决大模型的长期记忆问题。但是，Titans 还需要进一步的研究和改进，以满足实际应用的需求。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大模型的长期且动态的记忆能力出路在哪里？Google提出的Titans会是答案吗？
2025-05-04 20:32

bug菌¹的博客本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你...
如何用Titans神经记忆模块提升大模型的长文本处理能力？实战经验分享
2025-11-25 04:17

z2a3b4c5d的博客本文详细介绍了如何利用Titans神经记忆模块提升大模型的长文本处理能力，特别是在处理200万token的基因组序列等超长文本时的实战经验。通过参数动态解耦和梯度感知记忆技术，Titans在常规GPU上实现了显存优化和高效...
【技术解析】：Titans记忆机制——如何在测试时动态优化长期记忆
2025-09-06 03:03

mango的博客本文深入解析了Titans模型的动态记忆机制，它通过引入基于“惊喜度”的在线学习算法，在推理时动态优化长期记忆，有效解决了传统Transformer模型处理长序列时的记忆困境。该机制结合自适应遗忘与分块并行工程实现，...
谷歌Titans模型论文解析，Transformer迎来变革拐点——DeepSeek能否“接招”？
2025-02-03 17:34

硅基创想家的博客我们将深入探讨谷歌研究院的一篇新论文，该论文介绍了一种名为 Titans 的新模型架构。Titans 在缓解 Transformer 二次方成本问题的同时，展现出了令人期待的成果。Titans 模型的设计灵感来源于人类大脑的记忆运作...
谷歌Titans记忆革命：Transformer长文本困境的破局者，国产大模型如何应对？
2026-03-14 00:43

理柴德波浪技术的博客谷歌Titans模型通过引入神经长期记忆模块，创新性地解决了Transformer架构在处理长文本时面临的计算成本高和记忆瓶颈问题。该模型允许在推理过程中动态学习和更新记忆，显著提升了超长上下文的理解与推理能力。面对...
Transformer的‘记忆’短板怎么破？从Titans论文看大模型长上下文优化的三个新方向
2026-03-24 00:27

SO豹猫的博客本文探讨了Transformer架构在处理长上下文时的记忆短板，并基于Titans论文提出了三大创新方向：记忆作为门控(MAG)、记忆作为层(MAL)和混合记忆系统。这些技术突破显著提升了模型在长序列任务中的表现，为AI助手、...
从ChatGPT到Titans：大模型记忆机制演进与落地实践指南
2025-07-22 23:50

A3B4C5的博客本文深入探讨了大语言模型...文章解析了Titans基于“惊奇度”的动态记忆更新、MLP存储检索机制及三种工程整合策略，并提供了不同硬件配置下的部署指南与实战案例，为构建具备持久记忆能力的AI应用提供系统性解决方案。
大模型长期记忆技术分析[代码]
2025-12-31 06:03

随着人工智能技术的快速发展，大语言模型（LLMs）在处理信息时表现出极强的能力，但它们在长期记忆方面存在明显的限制。这些限制主要表现为两个方面：一是固定上下文窗口导致的记忆“健忘”问题，二是缺乏稳健的情景...
像人一样学会记忆，谷歌新架构Titans打破Transformer上下文限制
2025-01-17 08:45

大模型微调部署的博客基于此，提出一种新型的神经网络架构——，它通过引入来增强模型在处理长序列数据时的能力，受人类记忆中“违反预期的事件更难忘”这一观点的启发，定义了一个模型的惊讶度为其对输入的梯度。梯度越大，输入数据与...
Transformer过时了？从谷歌Titans看下一代架构：记忆网络如何重塑AI推理效率
2026-03-23 00:27

weixin_30316097的博客本文探讨了Transformer架构的局限性，并介绍了谷歌Titans模型如何通过记忆网络提升AI推理效率。Titans采用分层记忆设计、惊讶驱动更新和遗忘门控机制，显著降低显存占用和计算成本。文章还分析了四种架构变体的适用...
AI的记忆革命：从Titans架构到长时运行智能体，谷歌Google，Anthropic，NeurIPS 2025
2025-12-05 23:17

小胡说技书的博客谷歌Titans通过推理时动态更新的记忆模块，将上下文窗口扩展至200万token；Anthropic则用双智能体+进度文件的工程方案，让AI能跨多个会话持续工作。两条路径殊途同归：AI正在从"健忘的天才"进化为"能积累经验的伙伴...
从人脑记忆机制到AI模型：Titans架构如何实现真正的‘学习-遗忘‘循环？
2026-03-16 01:26

man One的博客通过模拟人类记忆的选择性编码、动态衰减和惊喜增强等特征，Titans架构在长期依赖建模任务中展现出显著优势，如基因组学序列分析和长文档理解。该架构的核心创新包括神经长期记忆模块、注意力短期记忆和惊讶度驱动的...
Google Titans 是否会终结基于 Transformer 的大语言模型（LLMs）
2025-01-18 14:34

新加坡内哥谈技术的博客自2024年底以来，生成式人工智能领域涌现了一股新趋势，那就是针对Transformer核心架构的创新，目标是提升其处理长上下文的能力并提高效率。GoogleTitans是一种全新的神经网络架构家族，专注于解决当前模型（尤其是...
200万token上下文能力，并且越用越聪明！Google Research重构AI长期记忆
2025-12-14 14:00

我很哇塞耶的博客 Transformer架构提出者，为谷歌提供基础研究、算法与生态底座的Google Research，要让AI拥有长期记忆。Google Research发布的Titans架构通过在推理阶段实时训练深层神经网络模块，让AI拥有了处理超过200万token上...
200万token上下文能力，并且越用越聪明！Google Research两篇重磅论文重构AI长期记忆
2025-12-10 15:43

算网社区的博客值得注意的是，这些模型在提升性能的同时，依然保持了高效的并行训练能力和快速的线性推理速度。固定大小的压缩像是一个容量有限的行囊，当旅途过长，新的信息不断涌入，旧的细节就会被迫丢弃，模型无法捕捉超长序列...
Titans + MIRAS：让AI拥有长期记忆能力
2025-12-31 17:08

至顶科技的博客 Titans + MIRAS：让AI拥有长期记忆能力
Titans记忆革命：Transformer长文本困境的破局者，DeepSeek如何应对新范式？
2025-10-14 03:42

sea99的博客谷歌Titans模型通过引入可动态学习的“神经长期记忆模块”，为Transformer架构带来了革命性突破，有效解决了长文本处理中的二次方计算成本难题。该模型在“大海捞针”等测试中表现卓越，为DeepSeek等主流模型应对长...
记忆的艺术：Titans模型在测试时学习记忆的全新探索
2025-01-19 20:11

步子哥的博客随着对记忆机制的深入理解，Titans模型有望在更广泛的任务中展现出更强的能力。在这篇文章中，我们将深入探讨Titans模型的设计与实现，特别是其在测试时学习记忆的能力。在未来的研究中，我们计划进一步优化Titans...
谷歌提出创新神经记忆架构 · Titans
2025-01-16 07:27

吕小明么的博客在回顾2024年AIGC浪潮中的诸多重大或小步快跑的事件当中，惊奇的发现在其中似乎存在着一条若隐若现且逐渐明朗的方法或思想，即：人类认知（人工智能）的形式化仿生迁移。另外，研究团队还特别优化了 Titans 的训练...
Titans架构解析：如何让AI在测试时学会高效记忆与检索
2025-11-16 09:36

DLC#的博客本文深入解析了Titans架构如何通过创新的神经长期记忆模块，让AI在测试时学会高效记忆与检索。该架构将短期注意力与长期记忆分离，利用基于梯度“惊讶度”的动态机制主动学习与遗忘，并可与注意力机制以多种方式融合...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月30日

大模型的长期且动态的记忆能力出路在哪里？Google提出的Titans会是答案吗？

大模型的长期且动态的记忆能力出路在哪里？Google提出的Titans会是答案吗？

起因

思考

6条回答 默认 最新

问题事件

6条回答默认最新