搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

大模型的“健忘症”有药了

2025-12-03 05:02:42
来源:

猫眼电影

作者:

约翰·罗杰斯

手机查看

  猫眼电影记者 张文魁 报道首次登录送91元红包

天才得了“健忘症”

过去的一年,大模型行业陷入了一场关于数字的军备竞赛。

从最初的8k Token上下文窗口,到随后的32k、128k,乃至近期已经有人喊出百万乃至千万级窗口。业界一度相信,只要窗口足够长,模型就能记住一切。企业主们试图将整座公司的知识库,倒入深不见底的输入框,以此炼就一位全知全能的数字员工。

然而,愿望很美好,现实很骨感。

在电商客服场景中,即便接入了顶流模型,支持超长文本,一旦对话超过十几轮,博学的AI依然会展现出“健忘”的一面:用户开门见山提到海鲜过敏,第五轮咨询商品时,AI依然热情推荐了含有海鲜的商品。而用户试图追溯之前的对话细节,提醒“基于我一开始说的预算”,模型却开始顾左右而言他。

大模型落地商业场景,常常遭遇隐形的高墙:输入越长,长程记忆越模糊;轮次越多,旧信息越快消散。

技术原理决定了这种局限。Transformer架构再先进,面对超长序列时,注意力机制也容易严重衰减。在人身上,这叫做“近因效应”,即对新发生的事情印象深刻,但久远的信息则被遗忘。在大模型身上,这意味着早期的精心指令会被后续的对话稀释,直到消失。

为了维持“记忆”,开发者不得不采取笨拙且烧钱的策略:把历史对话一次次打包,再次喂给模型。这就像为了让对方记住名字,你得在每句话开头都重新自我介绍一遍。Token消耗快速增长,每一次的简单问答,都是在烧钱。

多智能体的复杂任务中,缺失记忆共享机制,AI还会出现混乱。

企业通常将销售、客服、推荐、售后拆分给不同AI智能体。用户已向咨询智能体说明送货地址,但到售后智能体时仍需重新回答;用户刚向投诉智能体抱怨产品质量,推荐智能体转头继续推送产品升级版。这些场景本质上指向同一个问题:没有共享的长期记忆,AI之间无法协同,更谈不上理解。

现有的技术框架下,智能体往往各自维护独立的上下文窗口,这种割裂感导致了严重的决策冲突。

成本高昂、容易遗忘、协作割裂。企业花了大价钱引入大模型,得到的往往不是经验老到的资深员工,而是一群如果不反复重申指令就容易搞砸事情的“实习生”。

一个更接近人类记忆的方案,势在必行。

像人类一样记忆

“健忘”已成为制约大模型进一步提升的关键瓶颈。

过去一年,OpenAI、Anthropic、Google都在给大模型加“记忆层”,只是大多停留在产品功能层面,比如保留用户偏好、常见设定、近期对话线索,他们不知道什么该记,什么不该记。

而人工智能公司“红熊AI”尝试把“记忆”做成一套可管理、可共享、可追溯的基础设施,用来支撑多智能体、企业级应用和长期任务。这家从2024年11月份开始研发,内部商业化,到2025年11月经历过1年的时间,正式对外发布“记忆熊”,试图用反直觉地解决问题:跳出上下文窗口的参数竞赛,转向记忆科学。

底层逻辑并非“记住更多”,而是“记住更有价值的信息”。

记忆发端于数据。数据是未经加工的事实,例如37.5是个数字;当被处理并赋予意义,它便成了信息,如体温37.5摄氏度;信息进一步结构化,结合专业推论,形成“体温37.5度属于低烧”的判断,这便是知识;最后,知识转化为指导行为的能力,经过长期沉淀及验证,形成记忆,就可以给医生进行治疗决策。

在人类的认知视角下,存储不等于记忆。硬盘是容器,而记忆是动态的生命过程。红熊AI试图将人类大脑的记忆机制映射到AI架构中:

短期工作记忆,用于保持任务连接。这种模拟人类“感官缓存”的记忆,利用情感倾向加权算法,识别带有强烈情绪或关键指令的数据(如愤怒的投诉、明确的截止日期),将其标记为高优先级。

长期显性记忆,对应知识库和模型参数,用于沉淀经验;以及隐性记忆,对应用户偏好、企业“暗知识”,用于形成习惯和判断。

隐形记忆存储了用户的偏好模型、任务的隐式规则以及企业的“暗知识”,这是传统数据库最难处理的部分。比如,用户提到“加班”,AI应自动联想到“咖啡”或“打车”。同时将标准工作流程内化为“程序性记忆”,使AI在面对愤怒客户时,本能地执行安抚流程。

这部分记忆不会固化在大模型参数中,而由独立的“记忆模块”来存储和管理。系统的记忆萃取引擎可以决定:哪些应该保留?哪些应该遗忘?哪些应该在下一次用户提问时主动调用?

通过这种分层映射,记忆熊在硅基芯片之上重建了一套数字化记忆系统:“数字海马体”负责将信息加工、编码,“数字皮层”则作为仓库,长期存储知识和过往经历,而“数字杏仁核”则负责绑定情绪。

事实上,大模型深度赋能垂直行业的前提,正是拥有如人类般出色的记忆机制。

没有记忆,AI只能永远停留在“即时生成”的阶段,它能回答每一次问题,却无法从交互中成长。解决了记忆问题,AI才能进化为兼具理解与推理能力的智能体。

硅脑加装记忆外挂

精妙的记忆机制对技术能力提出了更高要求。

记忆熊的做法是构建记忆图谱,将各类记忆内容用结构化方式表达出来,挖掘分析这些记忆及相互关系,进而匹配出不同业务场景下需要的记忆和结构。这种结构化能力也赋予了AI一定的联想与多跳推理的能力,使得信息更连贯、推理更准确的同时,也能联动相关场景和背景知识。

如此一来,类似于人们听到“早晨”一词联想起“旭日东升”、“豆浆油条”、“公园遛鸟”或“交通拥堵”的使用场景也就不难实现了。

同时,记忆熊打通了平台,让智能体共用同一套用户记忆,不再各自为政,确保用户意图、情绪、历史问题等多样化标签无缝传递。用户一次提供信息,智能体同步获取,智能体群控记忆共享率达到了99.99%,基本能够消除因记忆不同步导致的服务问题。

这种针对“大模型健忘症”核心症结的深层次优化,使得记忆熊做到了“省、准、快”,为大模型在垂直领域的商业落地奠定了基础。

首先,是成本断崖式下降。通过引入独特的记忆分层存储机制,不需要每一轮对话中都回传所有的历史信息,压缩短期记忆为长期记忆摘要。这一机制让多轮对话累计的Token消耗直接降低了90%,对于那些每分钟都在烧钱的大模型应用来说,无异于神助。

其次,是精准度数量级提升。使用动态语境校准和智能语义剪枝技术,记忆熊将垂直场景的幻觉率压低到了0.2%以下,端到端的回应准确率达到了99.6%,大模型不再一本正经地胡说八道。特别在代表复杂逻辑能力的多跳推理和时序记忆上,记忆熊的表现领先诸多主流框架,证明它具备了区分过去与现在的时间感。

最后,是响应时间进一步缩短。人机交互中,延迟关乎体验。记忆熊基于向量的非图谱版本,成功将搜索请求的中位响应时间(Search Latency P50),即普通用户最常见的速度体验控制在0.137秒;语音交互场景下应答延迟仅0.8秒。当你话音刚落,AI的回答已经到达耳边,对话流畅自然。

“记忆即资产”

“记忆”的突破,终将重塑商业的形态。

在商业世界里,大模型有没有记忆,差异尤为明显。

客服AI若记不得用户投诉过的细节,就只能重复问题,无法取代真人;企业知识若不能不能转化为经验沉淀在系统里,AI就只能永远充当知识库;在教育、医疗及投顾等行业,若AI无法与客户建立持续深入的联系,它就无法进入高信任度的场景。

记忆不仅仅是一个功能,更是一种身份。

当AI有了持续的记忆,它就第一次具备了回答“我是谁?”、“我在与谁沟通?”、以及“我们之前达成过什么共识”的能力。

为充分利用记忆资产,红熊AI记忆熊产品明确了三条产品主线,分别是隐性记忆的显性化、记忆的结构化处理,以及记忆的场景化应用。简而言之,就是要将把AI与用户的交互沉淀为记忆,并在不同的业务场景下发挥作用。

模型参数里只有可复述的显性知识,但要企业的护城河往往在于隐性经验:金牌销售如何破冰?资深技工如何听音辨位?这些过去依赖个人经验的“暗知识”,现在可以通过记忆熊被结构化地沉淀下来,成为组织记忆,而非单个员工的独家记忆。

大模型没法记住一切,因为内容越多、参数越大、会话越长,则成本越高、遗忘越快、幻觉越多。记忆熊能帮助大模型构建一个“语义剪枝+记忆锚定+情境校准”的机制,结构化处理记忆,只保留与用户身份、历史行为及任务目标有关的核心记忆。

在企业的真实业务场景中,往往是多个智能体协同工作。记忆熊能记忆变为组织资产,而不是单个智能体的独家记忆,提升记忆共享率,则是模型协同的关键。

这三件事,推动记忆从技术功能拓展为商业基础设施。当企业开始关注“AI是否能复用经验、是否能像老员工一样理解上下文、是否能形成组织记忆”时,AI正式从工具进入体系阶段。

参数规模的战争终将结束,但智能体的进化才刚刚开始。

参数规模不是终局,记忆才可能成为真正的操作系统级入口。AI的下一场战役,不是“谁回答得更好”,而是“谁更记得住”,这仍然是一场初创公司可以参与的竞争。

跳出具体的商业场景,记忆实际上是通往通用人工智能(AGI)的必由之路。

没有记忆,就没有推理;没有记忆,也就没有智能。人类之所以成为万物之灵,是因为我们拥有强大的记忆系统,能够跨越时空积累经验,从历史中预判未来。

当前大模型虽然在语言生成上表现惊艳,但在逻辑推理、长期规划和自我进化上,依然有着巨大的进步空间。这归根结底,是因为它们缺乏一个稳定、连续且可塑的记忆系统。

红熊AI的探索,实际上是在补全AGI拼图中最关键的一块。它不仅让AI感知到数据的模式,还能理解并记住世界的规则。

红熊AI于2025年11月30日正式将记忆熊产品完全开源,邀请全球的开发者共同参与这场关于AI记忆的重构。

也许就在不久的将来,大模型的健忘症很快被治愈,一个拥有“累积性智慧”的时代就此徐徐拉开序幕。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4811016.html?f=wyxwapp

 时事1:mg在线平台

  12月03日,成都混团世界杯签表出炉 中国队与中国香港队同组,凭借独特区位成为航空枢纽的成功案例很多,比如迪拜、多哈、伊斯坦布尔,眼下阿拉木图也在这条路上努力着。,即时比分哦。

  12月03日,昆明机场口岸11月出入境客流量超33万人次,2013年,早在“一带一路”倡议提出时,对新疆的定位是:丝绸之路经济带上重要的交通枢纽、商贸物流和文化科教中心,打造丝绸之路经济带核心区。对陕西、甘肃、宁夏、青海的定位则为:面向中亚、南亚、西亚国家的通道、商贸物流枢纽、重要产业和人文交流基地。,乐鱼平台网站登录,万博手机端官网首页,188体育注册送18。

 时事2:华体会体育hth

  12月03日,青海构建融合发展体系 推动阅读从书页“走向”生活,张先生告诉《环球时报》记者,近年来走入网球馆和网球场的人越来越多,这一现象在郑钦文夺冠后更加明显,其中尤以青少年人群为多。,皇冠国际轮盘官网,葡京手机登陆,188金宝慱亚洲体育。

  12月03日,香港大埔火灾已致151死 调查指有人混用未达阻燃标准保护网,[环球时报报道 记者 倪浩]8月3日,郑钦文夺得2024巴黎奥运会网球女单冠军,实现中国选手在该项目上的历史性突破,也点燃了民众参与网球运动的热情,网球热度随之大涨。接受《环球时报》记者采访的专家认为,体育明星与体育经济会形成正向反馈:体育明星的示范效应会提振相关体育产业、吸引更多人参与到运动中来,大众的广泛参与则会成为“未来明星运动员”诞生的基石。,金沙新网址,mgm世界杯下注,bet9。

 时事3:必威中文官网

  12月03日,老挝艺术博物馆:“朽木”赋新生 展现老挝历史文化,该扩建工程是陕西民航发展的“头号工程”,也是目前西北投资规模最大、建筑体量最大的机场建设工程。,pg电子游戏试玩,口袋官方网站,多宝赌场网站。

  12月03日,作家梅洁谈《走进蓝色警营》:努力做好故事的记录者,曾文莉说,“要发展网球经济和其他体育经济,我们要思考一下,是否已将体育产业充分市场化,运动员的商业价值是否已充分释放,对体育产业、体育经济的杠杆作用是否已充分发挥。”她表示,“我们应该为明星运动员的商业活动营造更好的舆论环境、政策环境和制度环境。”,新加坡狮城网站下载,彩神彩票官方平台,炸金花哪个可以下载。

 时事4:线上买球平台首页

  12月03日,中医专家宋兆普辽沈“圈粉” 教学交流助推中医药文化传播,参与运营北京奥林匹克森林公园西畔的国家网球中心两片红土网球场地的维宁体育创始人、CEO纪宁8日告诉《环球时报》记者:“本就稀缺的网球场馆在郑钦文夺冠后变得更加炙手可热,现在根本都约不上。”,网投可靠平台排行,九州体育网站网址多少,外围足球哪里买。

  12月03日,中国大型船舶即将跨入自主“吊舱”时代,“实际上就是‘打样’。”李瀚明认为,国泰开航证明了乌鲁木齐机场具备保障顶级航司的能力,会产生示范效应。国泰飞得好,其他国际顶级航司,以及东亚、东南亚的航司都会考虑跟进。除了证明机场的保障能力,也是新疆以此为契机,对外释放开放活力的强烈信号。,免费牛牛最新版下载,365bet网页版,OD体育。

责编:谌鄂湘

审核:王硕

责编:黎皇

相关推荐 换一换