本站内容为虚构演示,与真实新闻及机构无关;请勿当作事实或专业意见。

全文

FULL TEXT

查看本期期刊
深度AI

合成记忆架构深度解析:AI如何形成长期记忆

DeepMind最新研究展示合成记忆架构SMA,让AI系统具备类似人类的情景记忆和语义记忆分离机制,在持续学习任务中遗忘率降低73%。

DeepMind于1月18日在《Nature Machine Intelligence》发表论文,详细介绍其合成记忆架构(Synthetic Memory Architecture, SMA)。这项研究试图解决AI系统长期面临的「灾难性遗忘」问题——当AI学习新知识时,旧知识会被覆盖。

SMA的核心设计灵感来自神经科学中对人类记忆系统的理解。人类大脑将记忆分为情景记忆(具体事件)和语义记忆(抽象知识),两者存储在不同的神经回路中。SMA模拟了这一机制,为AI系统设计了两个独立但可交互的记忆模块。

情景记忆模块采用连续向量编码方式,将每次交互的上下文信息压缩为高维向量并存储在外部记忆库中。语义记忆模块则通过知识图谱结构,将多次交互中提取的共性知识进行抽象和整合。两个模块之间通过一个「记忆巩固」机制进行定期同步。

在持续学习基准测试中,SMA的表现显著优于现有方法。在100个连续任务的学习测试中,传统微调方法的遗忘率达到89%,而SMA仅为16%。在需要跨任务知识迁移的场景中,SMA的迁移效率比EWC(弹性权重巩固)高出2.4倍。

论文第一作者Sarah Chen博士指出:「SMA不是在模仿人脑,而是在借鉴人脑的记忆组织原则。AI不需要像人一样记忆,但需要像人一样有选择地保留和遗忘。」

该架构已在DeepMind内部的Gemini系列模型中进行了小规模部署测试。初步结果显示,搭载SMA的模型在多轮对话中的一致性提升了41%,在长达6个月的持续交互中保持了稳定的知识库。

不过,SMA也面临挑战。记忆库的存储需求随交互次数线性增长,长期运行的系统需要定期进行「记忆清理」。DeepMind团队正在研究基于重要性评分的自动遗忘机制,试图让AI学会「战略性遗忘」。

清华大学计算机系教授黄民烈评论称,SMA代表了AI记忆研究的重要方向,但从工程角度看,如何在保证记忆质量的同时控制计算开销仍是关键问题。