合成记忆架构深度解析：AI如何形成长期记忆

DeepMind最新研究展示合成记忆架构SMA，让AI系统具备类似人类的情景记忆和语义记忆分离机制，在持续学习任务中遗忘率降低73%。

DeepMind于1月18日在《Nature Machine Intelligence》发表论文，详细介绍其合成记忆架构（Synthetic Memory Architecture, SMA）。这项研究试图解决AI系统长期面临的「灾难性遗忘」问题——当AI学习新知识时，旧知识会被覆盖。

SMA的核心设计灵感来自神经科学中对人类记忆系统的理解。人类大脑将记忆分为情景记忆（具体事件）和语义记忆（抽象知识），两者存储在不同的神经回路中。SMA模拟了这一机制，为AI系统设计了两个独立但可交互的记忆模块。

情景记忆模块采用连续向量编码方式，将每次交互的上下文信息压缩为高维向量并存储在外部记忆库中。语义记忆模块则通过知识图谱结构，将多次交互中提取的共性知识进行抽象和整合。两个模块之间通过一个「记忆巩固」机制进行定期同步。

在持续学习基准测试中，SMA的表现显著优于现有方法。在100个连续任务的学习测试中，传统微调方法的遗忘率达到89%，而SMA仅为16%。在需要跨任务知识迁移的场景中，SMA的迁移效率比EWC（弹性权重巩固）高出2.4倍。

论文第一作者Sarah Chen博士指出：「SMA不是在模仿人脑，而是在借鉴人脑的记忆组织原则。AI不需要像人一样记忆，但需要像人一样有选择地保留和遗忘。」

该架构已在DeepMind内部的Gemini系列模型中进行了小规模部署测试。初步结果显示，搭载SMA的模型在多轮对话中的一致性提升了41%，在长达6个月的持续交互中保持了稳定的知识库。

不过，SMA也面临挑战。记忆库的存储需求随交互次数线性增长，长期运行的系统需要定期进行「记忆清理」。DeepMind团队正在研究基于重要性评分的自动遗忘机制，试图让AI学会「战略性遗忘」。

清华大学计算机系教授黄民烈评论称，SMA代表了AI记忆研究的重要方向，但从工程角度看，如何在保证记忆质量的同时控制计算开销仍是关键问题。

免责声明

内容为AI生成，请勿作为事实或决策依据。转载、引用时请勿当作真实报道。