必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

AI memory 大賽覆蓋技術(shù)應用到基礎設施全層

2026年3月4日 16:30CCTIME飛象網(wǎng)

在大模型能力突飛猛進的這兩年里,行業(yè)幾乎把所有注意力都集中在參數(shù)規(guī)模、多模態(tài)、推理能力和算力效率上。

但在真實應用中,開發(fā)者很快發(fā)現(xiàn)了一個殘酷事實:模型會“忘事”。

無論是對用戶偏好的理解、對歷史決策的追溯,還是跨時間跨度的復雜推理,只要上下文窗口結(jié)束,一切都得從頭來過。RAG可以緩解一部分問題,但它更像是“臨時查資料”,而不是“真正記住”。

如果說大模型負責“思考”,那么記憶系統(tǒng)決定的,其實是智能體是否具備連續(xù)自我。

鄧亞峰認為,“如果模型每次會話后都會重置理解,真正的Agentic AI就無從談起!

EverMind正在從靜態(tài)的上下文窗口邁向動態(tài)、自組織的記憶,借助EverMemOS,為智能體提供了一段“活的、會演化的歷史”。

基準結(jié)果表明:EverMind能夠以遠低于全上下文模型的算力成本,實現(xiàn)更高的準確率。

正是在這一判斷下,EverMind把研發(fā)重心從模型能力本身,轉(zhuǎn)向了一個更底層,也更難的方向——AI Memory Infra。

EverMemOS:打破行業(yè)基準,點擊即用

在EverMind最新發(fā)布的論文EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中,團隊對現(xiàn)有主流方案進行了清晰區(qū)分。

截圖來源:EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning

EverMind詳細闡述了其技術(shù)提出的一套受engram啟發(fā)的生命周期機制,用以模擬生物認知過程。與傳統(tǒng)RAG或成本高昂的超長上下文窗口不同,EverMemOS能將經(jīng)驗組織為連貫、可演化的結(jié)構(gòu)。

它試圖構(gòu)建的,是一個類似生物認知系統(tǒng)的記憶生命周期,靈感直接來自神經(jīng)科學中的engram理論。

在這套架構(gòu)中,記憶不是靜態(tài)存儲,而是會被不斷壓縮、重組、強化和遺忘的動態(tài)系統(tǒng)。

EverMemOS的核心機制,被概括為三個連續(xù)但可循環(huán)的階段。

第一階段:情景痕跡形成(Episodic Trace Formation)。

將對話流轉(zhuǎn)換為MemCells,用于捕捉情景痕跡、原子事實以及有時間邊界的前瞻信息。

第二階段:語義鞏固(Semantic Consolidation)。

把MemCells動態(tài)組織為主題化的MemScenes,提煉穩(wěn)定的語義結(jié)構(gòu),并持續(xù)更新持久化的用戶畫像。

第三階段:重建式回憶(Reconstructive Recollection)。

通過agentic檢索組合“必要且充分”的推理上下文,在優(yōu)化算力成本的同時保證高準確率。

這也是EverMemOS能在大幅降低token消耗的同時,維持甚至提升準確率的關(guān)鍵。

基準成績,是硬指標

在AI基礎設施領(lǐng)域,架構(gòu)是否成立,最終要看基準測試。

EverMind在四個主流記憶評測基準上,給出了極具說服力的數(shù)據(jù)。

LoCoMo(93.05%準確率):超越全部現(xiàn)有記憶系統(tǒng)與全上下文模型;在多跳推理(+19.7%)與時序任務(+16.1%)上優(yōu)勢顯著,同時大幅降低token使用與計算成本。

LongMemEval(83.00%準確率):在知識更新與時序推理方面位居第一;其中知識更新任務提升20.6%,體現(xiàn)出系統(tǒng)可通過持續(xù)語義鞏固不斷“進化”的能力。

HaluMem(90.04%召回):在記憶完整性方面建立新的行業(yè)標準,顯著減少長時程任務中的幻覺。

PersonaMem v2:在9個復雜場景中,在深度個性化與行為一致性維度取得最佳綜合表現(xiàn)。

這說明EverMind不需要犧牲效率,去換取長期記憶。結(jié)構(gòu)本身,就是效率。

從論文到云服務:記憶能力的產(chǎn)品化

如果EverMemOS只停留在論文階段,它的意義仍然是學術(shù)層面的。

但是,EverMind顯然希望更快地進入真實應用場景。

此次同步推出的EverMemOS Cloud Service,正是為開發(fā)者和企業(yè)提供“即插即用”的記憶增強能力。通過簡單API調(diào)用,原本無狀態(tài)的聊天機器人,可以在數(shù)分鐘內(nèi)升級為具備長期上下文感知的智能體。

在設計上,該云服務強調(diào)三點:

一是企業(yè)級數(shù)據(jù)安全與隱私隔離; 

二是對底層記憶架構(gòu)的自動迭代; 

三是盡可能降低開發(fā)者的使用門檻。

目前,該服務已對候補名單(waitlist)用戶開放內(nèi)測,也可以通過官網(wǎng)申請加入內(nèi)測:console.evermind.ai。

Memory Genesis:把基礎設施交到生態(tài)手里

與產(chǎn)品發(fā)布同樣重要的,是EverMind對生態(tài)的態(tài)度。

Memory Genesis Competition 2026,并不想做成一次常規(guī)的應用開發(fā)大賽,而是圍繞“記憶原生應用”展開的系統(tǒng)性共創(chuàng)。

圖片來源:EverMind

賽事設置了Memory+Agent、Plugin和Infra三大賽道,覆蓋從應用到基礎設施的不同層級。初始獎金池為8萬美元,并提供后續(xù)收入分成與職業(yè)機會。

優(yōu)秀開發(fā)者不僅能獲得獎金,還可能直接進入EverMind工程團隊,或獲得長期技術(shù)支持。

開發(fā)者可在2月線上參賽并提交作品,3月份將在社區(qū)逐步公布優(yōu)秀項目,并將邀請優(yōu)秀團隊參加4月初在硅谷舉辦的線下活動。

開發(fā)者可在evermind.ai/activities注冊。

編 輯:T01
飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 專題|2026世界移動通信大會

    2026年3月2日至5日,世界移動通信大會(MWC)在西班牙巴塞羅那Fira Gran Via會展中心拉開帷幕。本屆展會以“The IQ Era”(眾智啟新)為主題,向世界展示AI與通信深度融合的無限可能。..[詳細]

  • MWC26啟幕:AI+通信深度融合,重構(gòu)行業(yè)價值邏輯

    三月的巴塞羅那,科技盛宴如期而至。3月2日至5日,世界移動通信大會(MWC26)將拉開帷幕,恰逢展會落戶當?shù)?0周年,這場全球通信行業(yè)的開春盛事,正承載著定義下一個十年科技革命和產(chǎn)業(yè)變革..[詳細]

  • 從“參與”到“主導”:華為開源之路越走越寬

    如今國內(nèi)使用開源軟件、貢獻開源社區(qū)已經(jīng)蔚然成風,不過很少有企業(yè)像華為一樣迅速從使用開源、參與開源到成為諸多大型開源項目的主要貢獻者。華為計算開源業(yè)務總經(jīng)理李永樂在近日接受采訪時..[詳細]

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像