|
近日,由盛大集团全资孵化的AI技术团队EverMind,正式对外系统性地展示AI记忆操作系统——EverMemOS,最新版本在四大记忆基准上实现了最先进(SOTA)准确率。 这背后是陈天桥对“基础性技术长期投入”的一贯判断,也是EverMind联合创始人邓亚峰在AI记忆基础设施方向上的一次正面下注。 在产品发布之外,这也更像是一次针对“AI是否能真正成为长期智能体”的底层挑战。 为什么Agent一定需要长期记忆? 在大模型能力突飞猛进的这两年里,行业几乎把所有注意力都集中在参数规模、多模态、推理能力和算力效率上。 但在真实应用中,开发者很快发现了一个残酷事实:模型会“忘事”。 无论是对用户偏好的理解、对历史决策的追溯,还是跨时间跨度的复杂推理,只要上下文窗口结束,一切都得从头来过。RAG可以缓解一部分问题,但它更像是“临时查资料”,而不是“真正记住”。 如果说大模型负责“思考”,那么记忆系统决定的,其实是智能体是否具备连续自我。 邓亚峰认为,“如果模型每次会话后都会重置理解,真正的Agentic AI就无从谈起。” EverMind正在从静态的上下文窗口迈向动态、自组织的记忆,借助EverMemOS,为智能体提供了一段“活的、会演化的历史”。 基准结果表明:EverMind能够以远低于全上下文模型的算力成本,实现更高的准确率。 正是在这一判断下,EverMind把研发重心从模型能力本身,转向了一个更底层,也更难的方向——AI Memory Infra。 EverMemOS:打破行业基准,点击即用 在EverMind最新发布的论文EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中,团队对现有主流方案进行了清晰区分。
截图来源:EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning EverMind详细阐述了其技术提出的一套受engram启发的生命周期机制,用以模拟生物认知过程。与传统RAG或成本高昂的超长上下文窗口不同,EverMemOS能将经验组织为连贯、可演化的结构。 它试图构建的,是一个类似生物认知系统的记忆生命周期,灵感直接来自神经科学中的engram理论。 在这套架构中,记忆不是静态存储,而是会被不断压缩、重组、强化和遗忘的动态系统。 EverMemOS的核心机制,被概括为三个连续但可循环的阶段。 第一阶段:情景痕迹形成(Episodic Trace Formation)。 将对话流转换为MemCells,用于捕捉情景痕迹、原子事实以及有时间边界的前瞻信息。 第二阶段:语义巩固(Semantic Consolidation)。 把MemCells动态组织为主题化的MemScenes,提炼稳定的语义结构,并持续更新持久化的用户画像。 第三阶段:重建式回忆(Reconstructive Recollection)。 通过agentic检索组合“必要且充分”的推理上下文,在优化算力成本的同时保证高准确率。 这也是EverMemOS能在大幅降低token消耗的同时,维持甚至提升准确率的关键。 基准成绩,是硬指标 在AI基础设施领域,架构是否成立,最终要看基准测试。 EverMind在四个主流记忆评测基准上,给出了极具说服力的数据。 LoCoMo(93.05%准确率):超越全部现有记忆系统与全上下文模型;在多跳推理(+19.7%)与时序任务(+16.1%)上优势显著,同时大幅降低token使用与计算成本。 LongMemEval(83.00%准确率):在知识更新与时序推理方面位居第一;其中知识更新任务提升20.6%,体现出系统可通过持续语义巩固不断“进化”的能力。 HaluMem(90.04%召回):在记忆完整性方面建立新的行业标准,显著减少长时程任务中的幻觉。 PersonaMem v2:在9个复杂场景中,在深度个性化与行为一致性维度取得最佳综合表现。 这说明EverMind不需要牺牲效率,去换取长期记忆。结构本身,就是效率。 从论文到云服务:记忆能力的产品化 如果EverMemOS只停留在论文阶段,它的意义仍然是学术层面的。 但是,EverMind显然希望更快地进入真实应用场景。 此次同步推出的EverMemOS Cloud Service,正是为开发者和企业提供“即插即用”的记忆增强能力。通过简单API调用,原本无状态的聊天机器人,可以在数分钟内升级为具备长期上下文感知的智能体。 在设计上,该云服务强调三点: 一是企业级数据安全与隐私隔离; 二是对底层记忆架构的自动迭代; 三是尽可能降低开发者的使用门槛。 目前,该服务已对候补名单(waitlist)用户开放内测,也可以通过官网申请加入内测:console.evermind.ai。 对陈天桥和邓亚峰而言,这是一次对“长期价值”的再次下注,为Agentic AI补上一块关键拼图的尝试。 多数AI应用的失败,也许并不是因为模型不够聪明,而是因为系统不够完整。 EverMemOS至少回答了一个长期被忽视的问题:如果AI没有记忆,它到底是谁? 而这,或许正是下一阶段智能竞争真正开始的地方。 |
正在阅读:陈天桥押注 AI 记忆基础设施把握产业新机遇陈天桥押注 AI 记忆基础设施把握产业新机遇
2026-03-04 16:45
其他
编辑:侯宪勇

相关文章
陈天桥押注 AI 记忆基础设施把握产业新机遇
担心错过比分动态?鸿蒙版咪咕视频、雷速体育比赛实况窗尽在掌握
十年前离开PC,现在为何杀回来?腾讯应用宝“跨端引擎”来揭秘
用友企业AI的四次跨越,SaaS领跑的还是YonSuite?
太卷!OpenClaw中文版Molili大更新:接入微信飞书、8000+技能全开
开学复工用小艺,深度研究、文档处理秒应答,办公学习都高效
AI 与速度的融合升级:Oracle 助力甲骨文红牛车队开启新一轮性能革命
535亿小游戏市场增速领跑,鸿蒙无网小游戏成MWC沿途一景
优秀三连!微柏软件助力武深高速始兴联络线、雄信高速及中江改扩建通过档案专项验收
给爸妈换大屏手机前,记得先打开鸿蒙6这个设置

西门子(SIEMENS)274升大容量家用三门冰箱 混冷无霜 零度保鲜 独立三循环 玻璃面板 支持国家补贴 KG28US221C
5399元
苏泊尔电饭煲家用3-4-5-8个人4升电饭锅多功能一体家用蓝钻圆厚釜可做锅巴饭煲仔饭智能煮粥锅预约蒸米饭 不粘厚釜 4L 5-6人可用
329元
绿联65W氮化镓充电器套装兼容45W苹果16pd多口Type-C快充头三星华为手机MacbookPro联想笔记本电脑配线
99元
KZ Castor双子座有线耳机入耳式双单元HM曲线发烧HiFi耳返耳麦
88元
格兰仕(Galanz)【国家补贴】电烤箱 家用 40L大容量 上下独立控温 多层烤位 机械操控 烘培炉灯多功能 K42 经典黑 40L 黑色
260.9元
漫步者(EDIFIER)M25 一体式电脑音响 家用桌面台式机笔记本音箱 蓝牙5.3 黑色 520情人节礼物
109元

