天才得了“健忘症”
过去的一年,大模型行业陷入了一场关于数字的军备竞赛。
从最初的8k Token上下文窗口,到随后的32k、128k,乃至近期已经有人喊出百万乃至千万级窗口。业界一度相信,只要窗口足够长,模型就能记住一切。企业主们试图将整座公司的知识库,倒入深不见底的输入框,以此炼就一位全知全能的数字员工。
然而,愿望很美好,现实很骨感。
在电商客服场景中,即便接入了顶流模型,支持超长文本,一旦对话超过十几轮,博学的AI依然会展现出“健忘”的一面:用户开门见山提到海鲜过敏,第五轮咨询商品时,AI依然热情推荐了含有海鲜的商品。而用户试图追溯之前的对话细节,提醒“基于我一开始说的预算”,模型却开始顾左右而言他。
大模型落地商业场景,常常遭遇隐形的高墙:输入越长,长程记忆越模糊;轮次越多,旧信息越快消散。
技术原理决定了这种局限。Transformer架构再先进,面对超长序列时,注意力机制也容易严重衰减。在人身上,这叫做“近因效应”,即对新发生的事情印象深刻,但久远的信息则被遗忘。在大模型身上,这意味着早期的精心指令会被后续的对话稀释,直到消失。
为了维持“记忆”,开发者不得不采取笨拙且烧钱的策略:把历史对话一次次打包,再次喂给模型。这就像为了让对方记住名字,你得在每句话开头都重新自我介绍一遍。Token消耗快速增长,每一次的简单问答,都是在烧钱。
多智能体的复杂任务中,缺失记忆共享机制,AI还会出现混乱。
企业通常将销售、客服、推荐、售后拆分给不同AI智能体。用户已向咨询智能体说明送货地址,但到售后智能体时仍需重新回答;用户刚向投诉智能体抱怨产品质量,推荐智能体转头继续推送产品升级版。这些场景本质上指向同一个问题:没有共享的长期记忆,AI之间无法协同,更谈不上理解。
现有的技术框架下,智能体往往各自维护独立的上下文窗口,这种割裂感导致了严重的决策冲突。
成本高昂、容易遗忘、协作割裂。企业花了大价钱引入大模型,得到的往往不是经验老到的资深员工,而是一群如果不反复重申指令就容易搞砸事情的“实习生”。
一个更接近人类记忆的方案,势在必行。
像人类一样记忆
“健忘”已成为制约大模型进一步提升的关键瓶颈。
过去一年,OpenAI、Anthropic、Google都在给大模型加“记忆层”,只是大多停留在产品功能层面,比如保留用户偏好、常见设定、近期对话线索,他们不知道什么该记,什么不该记。
而人工智能公司“红熊AI”尝试把“记忆”做成一套可管理、可共享、可追溯的基础设施,用来支撑多智能体、企业级应用和长期任务。这家从2024年11月份开始研发,内部商业化,到2025年11月经历过1年的时间,正式对外发布“记忆熊”,试图用反直觉地解决问题:跳出上下文窗口的参数竞赛,转向记忆科学。
底层逻辑并非“记住更多”,而是“记住更有价值的信息”。
记忆发端于数据。数据是未经加工的事实,例如37.5是个数字;当被处理并赋予意义,它便成了信息,如体温37.5摄氏度;信息进一步结构化,结合专业推论,形成“体温37.5度属于低烧”的判断,这便是知识;最后,知识转化为指导行为的能力,经过长期沉淀及验证,形成记忆,就可以给医生进行治疗决策。
在人类的认知视角下,存储不等于记忆。硬盘是容器,而记忆是动态的生命过程。红熊AI试图将人类大脑的记忆机制映射到AI架构中:
短期工作记忆,用于保持任务连接。这种模拟人类“感官缓存”的记忆,利用情感倾向加权算法,识别带有强烈情绪或关键指令的数据(如愤怒的投诉、明确的截止日期),将其标记为高优先级。
长期显性记忆,对应知识库和模型参数,用于沉淀经验;以及隐性记忆,对应用户偏好、企业“暗知识”,用于形成习惯和判断。
隐形记忆存储了用户的偏好模型、任务的隐式规则以及企业的“暗知识”,这是传统数据库最难处理的部分。比如,用户提到“加班”,AI应自动联想到“咖啡”或“打车”。同时将标准工作流程内化为“程序性记忆”,使AI在面对愤怒客户时,本能地执行安抚流程。
这部分记忆不会固化在大模型参数中,而由独立的“记忆模块”来存储和管理。系统的记忆萃取引擎可以决定:哪些应该保留?哪些应该遗忘?哪些应该在下一次用户提问时主动调用?
通过这种分层映射,记忆熊在硅基芯片之上重建了一套数字化记忆系统:“数字海马体”负责将信息加工、编码,“数字皮层”则作为仓库,长期存储知识和过往经历,而“数字杏仁核”则负责绑定情绪。
事实上,大模型深度赋能垂直行业的前提,正是拥有如人类般出色的记忆机制。
没有记忆,AI只能永远停留在“即时生成”的阶段,它能回答每一次问题,却无法从交互中成长。解决了记忆问题,AI才能进化为兼具理解与推理能力的智能体。
硅脑加装记忆外挂
精妙的记忆机制对技术能力提出了更高要求。
记忆熊的做法是构建记忆图谱,将各类记忆内容用结构化方式表达出来,挖掘分析这些记忆及相互关系,进而匹配出不同业务场景下需要的记忆和结构。这种结构化能力也赋予了AI一定的联想与多跳推理的能力,使得信息更连贯、推理更准确的同时,也能联动相关场景和背景知识。
如此一来,类似于人们听到“早晨”一词联想起“旭日东升”、“豆浆油条”、“公园遛鸟”或“交通拥堵”的使用场景也就不难实现了。
同时,记忆熊打通了平台,让智能体共用同一套用户记忆,不再各自为政,确保用户意图、情绪、历史问题等多样化标签无缝传递。用户一次提供信息,智能体同步获取,智能体群控记忆共享率达到了99.99%,基本能够消除因记忆不同步导致的服务问题。
这种针对“大模型健忘症”核心症结的深层次优化,使得记忆熊做到了“省、准、快”,为大模型在垂直领域的商业落地奠定了基础。
首先,是成本断崖式下降。通过引入独特的记忆分层存储机制,不需要每一轮对话中都回传所有的历史信息,压缩短期记忆为长期记忆摘要。这一机制让多轮对话累计的Token消耗直接降低了90%,对于那些每分钟都在烧钱的大模型应用来说,无异于神助。
其次,是精准度数量级提升。使用动态语境校准和智能语义剪枝技术,记忆熊将垂直场景的幻觉率压低到了0.2%以下,端到端的回应准确率达到了99.6%,大模型不再一本正经地胡说八道。特别在代表复杂逻辑能力的多跳推理和时序记忆上,记忆熊的表现领先诸多主流框架,证明它具备了区分过去与现在的时间感。
最后,是响应时间进一步缩短。人机交互中,延迟关乎体验。记忆熊基于向量的非图谱版本,成功将搜索请求的中位响应时间(Search Latency P50),即普通用户最常见的速度体验控制在0.137秒;语音交互场景下应答延迟仅0.8秒。当你话音刚落,AI的回答已经到达耳边,对话流畅自然。
“记忆即资产”
“记忆”的突破,终将重塑商业的形态。
在商业世界里,大模型有没有记忆,差异尤为明显。
客服AI若记不得用户投诉过的细节,就只能重复问题,无法取代真人;企业知识若不能不能转化为经验沉淀在系统里,AI就只能永远充当知识库;在教育、医疗及投顾等行业,若AI无法与客户建立持续深入的联系,它就无法进入高信任度的场景。
记忆不仅仅是一个功能,更是一种身份。
当AI有了持续的记忆,它就第一次具备了回答“我是谁?”、“我在与谁沟通?”、以及“我们之前达成过什么共识”的能力。
为充分利用记忆资产,红熊AI记忆熊产品明确了三条产品主线,分别是隐性记忆的显性化、记忆的结构化处理,以及记忆的场景化应用。简而言之,就是要将把AI与用户的交互沉淀为记忆,并在不同的业务场景下发挥作用。
模型参数里只有可复述的显性知识,但要企业的护城河往往在于隐性经验:金牌销售如何破冰?资深技工如何听音辨位?这些过去依赖个人经验的“暗知识”,现在可以通过记忆熊被结构化地沉淀下来,成为组织记忆,而非单个员工的独家记忆。
大模型没法记住一切,因为内容越多、参数越大、会话越长,则成本越高、遗忘越快、幻觉越多。记忆熊能帮助大模型构建一个“语义剪枝+记忆锚定+情境校准”的机制,结构化处理记忆,只保留与用户身份、历史行为及任务目标有关的核心记忆。
在企业的真实业务场景中,往往是多个智能体协同工作。记忆熊能记忆变为组织资产,而不是单个智能体的独家记忆,提升记忆共享率,则是模型协同的关键。
这三件事,推动记忆从技术功能拓展为商业基础设施。当企业开始关注“AI是否能复用经验、是否能像老员工一样理解上下文、是否能形成组织记忆”时,AI正式从工具进入体系阶段。
参数规模的战争终将结束,但智能体的进化才刚刚开始。
参数规模不是终局,记忆才可能成为真正的操作系统级入口。AI的下一场战役,不是“谁回答得更好”,而是“谁更记得住”,这仍然是一场初创公司可以参与的竞争。
跳出具体的商业场景,记忆实际上是通往通用人工智能(AGI)的必由之路。
没有记忆,就没有推理;没有记忆,也就没有智能。人类之所以成为万物之灵,是因为我们拥有强大的记忆系统,能够跨越时空积累经验,从历史中预判未来。
当前大模型虽然在语言生成上表现惊艳,但在逻辑推理、长期规划和自我进化上,依然有着巨大的进步空间。这归根结底,是因为它们缺乏一个稳定、连续且可塑的记忆系统。
红熊AI的探索,实际上是在补全AGI拼图中最关键的一块。它不仅让AI感知到数据的模式,还能理解并记住世界的规则。
红熊AI于2025年11月30日正式将记忆熊产品完全开源,邀请全球的开发者共同参与这场关于AI记忆的重构。
也许就在不久的将来,大模型的健忘症很快被治愈,一个拥有“累积性智慧”的时代就此徐徐拉开序幕。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4811016.html?f=wyxwapp
《开云体育官网登录平台》,《首次登录送91元红包》国际音标 真人朗读 软件下载
“金莎娱乐游戏平台”
ManBetX大小
……
{!! riqi() !!}
“ballbet贝博BB狼堡体育”{!! reci() !!}
↓↓↓
{!! riqi() !!},文明不是孤岛:中外专家共话文化交流与可持续发展,BET9九州注册,bet官网体育,赌王排行榜,365bet在线手机客户端
{!! riqi() !!},皇岗口岸快捷通道扩容 深港跨境通行再提速,乐鱼官网登录在线入口,真人示范发音 app 国际音标,im电竞赌场网站,新2官网总网址
{!! riqi() !!},香港民众悼念宏福苑火灾殉职消防员,hth华体会体育APP,九游体育网页登陆,跟满贯捕鱼一样模式的游戏,棋牌王真钱斗地主
{!! riqi() !!}|南部战区位中国黄岩岛领海领空及周边区域组织战备警巡|皇冠体育正规|manbetx万博手机注册登录|bbin体育登陆开户|优博线路检测
{!! riqi() !!}|泡泡玛特在上海南京路再开旗舰店 形成独特的“双旗舰店”格局|明升88下载|AG亚游最新地址|世界杯网上在哪买球|亚新体育投注登录
{!! riqi() !!}|河南洛阳:邂逅霞光里的高铁站台|世界杯复式投注|99真人国际平台|bobsports下载|腾龙在线客服联系方式……
{!! riqi() !!},这些交通细节,关系日常出行安全,188betapp平台,官网体育在线365,银河国际游戏平台,888真人客户端下载
{!! riqi() !!},受沙尘影响 30日北京PM10浓度预计有短时轻中度污染,美高梅平台网址手机版官网,凯发娱乐官网登录欢迎你,极速体育直播,永利电子注册
{!! riqi() !!}|“听见当代中国:中央音乐学院作曲家室内乐音乐会”奏响德国汉堡|超级连环夺宝官网|真钱888棋牌平台|世界杯怎么线上投注|篮球188直播比分直播
{!! riqi() !!},受沙尘影响 30日北京PM10浓度预计有短时轻中度污染,百家的补牌规则图,188bet,波音线上大全ag,澳门皇冠官网视频直播
{!! riqi() !!},工信部:2025年前10月通信业运行总体平稳,365官网手机正版下载,od体育官方app,6up一直账号密码错误,千赢国际免费试玩
{!! riqi() !!},全国优秀体操小将在南宁开展集训,凯发娱乐手机客户端下载,电子竞技投注网站,银河官网娱乐场网站,永乐国际官方网
{!! riqi() !!}|同心助香江 统一战线在行动|澳门棋盘|金贝体育|12bet手机登录|六合风采B
{!! riqi() !!}|外国人看《黑猫警长》学中文|外围滚球app排行|世界杯投注地址在哪里|美高梅充值中心|必威官网入口
{!! riqi() !!}|习近平致信祝贺中国志愿服务联合会第三届会员代表大会召开强调 大力弘扬志愿精神传递真善美传播正能量 为强国建设民族复兴伟业贡献志愿服务力量|千赢国际苹果版|皇冠游戏平台|银河游戏官网|AG国际馆
{!! reci() !!},{!! reci() !!}|在轨一个月 神舟二十一号乘组各项工作按计划推进|博狗体育在线|威廉希尔网址入口|奔驰宝马娱乐|葡京投注
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺