Replika 的官方說明中心宣稱它「會保留從一開始到現在的所有內容」。但拆解分析說的卻是另一回事:模型其實只看得到大約最後 25 則訊息,再早的全都躺在你的帳號裡,AI 在推論當下根本讀不到(thredly.io)。歷史紀錄是存下來了,卻沒有被記住。問題的全部癥結,就在這道落差。
如果你曾經告訴某個角色你的名字、你的背景故事、你們在第一天一起決定的某件事,然後看著它在五十則訊息之後一臉茫然,你就親身體會過這種感覺。聊天紀錄明明就在你的螢幕上,模型只是沒在看而已。
AI 角色為什麼會忘記
語言模型並不像你一樣,對整段對話保有一份持續更新的記憶。每一個回合,它都會讀進一塊固定大小的文字,這塊文字叫做「上下文視窗」(context window),生成一段回覆,然後就忘了自己曾經讀過。任何塞不進這一回合視窗的內容,等於不存在。
當一段對話成長到超出視窗能容納的範圍,最舊的文字就會被擠出去,好騰出空間給最新的內容。更大的視窗能換來更多空間,但代價是更貴、延遲更高,而且中段會劣化:模型在面對長提示時,總是會弄丟夾在開頭和結尾之間的資訊,這就是所謂「迷失在中間」(lost in the middle)的效應(Atlan、bitfern)。所以遺忘並不是一個修一修就能解決的 bug,它是這套架構的預設行為。下面所有的內容,都是想方設法繞過它的嘗試。
AI 能「記住」的各種方式(以及每一種怎麼失靈)
每一套記憶系統,本質上都是一種策略:在對的時機,把對的舊文字重新塞回那個固定的視窗裡。每一種都在「召回率」與「成本、延遲」之間做取捨,而且各自帶著一種專屬的失靈模式。
滾動式摘要(Rolling summarization)。 由一個 LLM 把舊的對話回合壓縮成一份持續更新的摘要,跟著提示一起送進去。它便宜又精簡,但天生就是有損的:每壓縮一次,都會為了保持簡短而丟掉一些細節。某個只在第一天提過一次的事實,撐過了第一次壓縮,第二次被稀釋,到第三次就徹底消失了。你不會立刻察覺,直到角色開始牴觸某件你們一週前才一起確立的事(mem0、Recursively Summarizing, arXiv)。
Lorebook/World Info。 你親手寫下一條條的條目,每一條只有在它的觸發關鍵字出現在文字裡時,才會被注入(SillyTavern 文件)。一旦觸發,它非常精準。問題在於 AI 對自己的 lorebook 預設是看不見的,非得等某個關鍵字把對應條目喚醒才行:只要你換句話說、把觸發字拼錯,或是用拐個彎的方式提到那件事,這條條目就會默默地永遠不載入。知識明明存在,卻始終看不見。
向量/RAG 檢索。 每一則訊息都會被轉成向量(embedding)並儲存起來。每個回合,系統會檢索出和你剛剛所說最相似的片段,再把它們貼進去(freeCodeCamp)。它能擴展到龐大的歷史紀錄,這正是它真正的強項。但它也會在「最相似」不等於「最相關」時撈出錯誤的片段,而一段被自信地檢索出來的錯誤記憶,比完全沒有記憶還糟:它等於餵給模型一個錯誤的前提,讓模型在上面繼續蓋下去。
多層/結構化記憶(Multi-layer / structured memory)。 與其直接傾倒原始文字,不如由一個 LLM 萃取出重要事實,並發出新增、更新、刪除等操作;或是像當年 Generative Agents 那項研究所做的那樣,依「新近度、重要性、相關性」為記憶評分(arXiv 綜述、Generative Agents)。這已經比較接近「記憶」應該有的感覺了。但它也多出了一個可能出錯的步驟:HaluMem 這項基準測試顯示,記憶系統會在萃取、更新與檢索這幾個階段捏造與遺失資訊(HaluMem, arXiv)。記憶會產生幻覺,它不只是會遺忘而已。
知識圖譜(Knowledge graphs)。 實體變成節點,關係變成邊,再用帶時間性的邊去追蹤某件事「是什麼時候發生的」相對於「是什麼時候被學到的」(Zep / Graphiti 論文)。它是結構化程度最高的選項,但隨著故事不斷分岔,要把它建起來並維持乾淨,工程量也最大。
從這裡可以得出兩件事。第一,這個取捨是真實而無法迴避的:召回率,對上成本,對上延遲,對上捏造記憶的風險。第二,更大的上下文視窗並不是一套記憶系統。超過某個臨界點之後,舊資訊反而會主動阻擋對較新資訊的召回(這叫「前攝干擾」,proactive interference),而在高度干擾下,檢索不會優雅地逐步退化,而是直接崩塌成捏造(前攝干擾研究, arXiv)。更多的 token,只是更大的乾草堆,而不是一根更好的針。
各家平台怎麼處理這件事
以下簡短說明誰負責什麼、又各自在哪裡裂開。表格裡的內容是刻意寫得很精簡的。
| 平台 | 它如何記憶 | 它在哪裡失靈 |
|---|---|---|
| Character.AI | 釘選訊息,再加上一個換到別段對話就會遺忘的視窗 | 遺忘與上下文腐化(context rot)是用戶抱怨榜上的前幾名(404 Media) |
| AI Dungeon | 可編輯的 Story Summary,再加上一層 Memory Bank RAG 與關鍵字 Story Cards(Latitude、說明) | 記憶槽位依方案分級設上限,並採「最少使用優先汰除」;在精確關鍵字載入之前,AI 對某張 Story Card 是看不見的(說明) |
| SillyTavern | 你親手把 World Info、Author's Note、Summarize 與 Vector Storage 一層層疊起來(World Info、Summarize) | 全靠手動;以關鍵字綁定的條目會錯過沒踩中關鍵字的說法;Summarize 文件本身就警告輸出會「漂移與產生幻覺」 |
| Kindroid | 永遠在上下文裡的背景故事,加上可檢索的長期記憶與一份關鍵字日誌(文件) | 文件坦承長期記憶「可能並不可靠」;最深的層級要付費;日誌關鍵字必須逐字相符 |
| Nomi | 一張會隨著漫長歷史逐步建立起來的 Mind Map(Nomi) | 這張圖要累積約 500 則訊息之後才會成形,而可靠的召回更要綁到 1,000 則以上;Identity Core 既不能查看也不能編輯 |
| Replika | 帳號宣稱會保留從一開始到現在的所有內容(thredly) | 模型其實只看得到約 25 則最近的訊息;其餘的雖有儲存,在推論當下卻看不見 |
| Saga | 能在漫長故事裡記得住;世界觀設定由你來定 | 在預覽階段,作品庫仍然偏少 |
其中有幾家值得各補一句。SpicyChat 把 lorebook 鎖在付費方案後面,並把免費方案的上下文上限壓在 4,096 個 token,所以在任何技巧派上用場之前,那裡的記憶本身就已經很短了(SpicyChat 文件)。NovelAI 的 lorebook 則是靠關鍵字觸發來啟動條目(NovelAI 文件),跟其他所有人一樣,是同一套既精準又脆弱的模式。
那麼,「真正管用的記憶」到底是什麼意思?
注意一下這張表格裡沒有的東西:沒有任何一個平台是「永遠不會忘記」的。任何向你保證這一點的人,賣給你的不過是 Replika 那句「保留所有內容」的行銷版本。真正有用的問題其實更窄:就在別處那些釘選與持久記憶會明顯崩掉的同一個關卡,當故事拉長之後,角色是不是還記得真正重要的事?
而跨過那道門檻,正是 Saga 打造出來要做的事。重點在於體驗:角色會記住一段漫長故事裡發生過的事,會回頭呼應它,也會因為它而改變;而你來設定那套錨定整個世界的世界觀,讓 AI 是依照你的正典(canon)在運作,而不是自己用猜的。比較短、比較輕鬆的場景,一樣放得進來。
有一個你可以自己跑跑看的測試。先確立一件事實,然後往後玩 200 則訊息,再用拐個彎的方式提到它,看看角色是不是還記得。那正是摘要會把細節丟掉、而關鍵字 lorebook 會保持沉默的那一刻,也正是 Saga 為之打造的那種情境。在記憶之外,其餘的環節也站得住腳:Saga 會透過 OpenRouter 在多個模型之間路由,所以萬一某家供應商的品質下滑,你也不會被綁死在它身上。內容界線由創作者自己設定,只有一條不會移動的硬底線:絕不涉及未成年人。對話在傳輸過程中加密、安全儲存,絕不出售,也絕不用來訓練模型。它採點數(credits)制,一開始會送你免費點數,自備金鑰(bring-your-own-key)的選項也在規劃中;目前則處於預覽階段,採候補名單制。
如果你想盤點更大的版圖,我們這篇Character.AI 替代方案指南,會從價格、內容政策,以及各自適合誰這幾個角度,把上面這些平台一一講過。
常見問題
Character.AI 為什麼什麼都記不住? 它的模型每個回合都讀一塊固定的上下文視窗,一旦對話長到超出那個視窗,最舊的文字就會被裁掉。長對話純粹就是超過了模型一次能容納的量,而遺忘與上下文腐化也正是最常見的抱怨之一(404 Media)。歷史紀錄其實還存在你的帳號裡,只是模型沒辦法一次全部看到而已。
哪一個 AI 角色扮演的記憶最好? 這要看你在做什麼。如果是一個你每天都會回去找的夥伴,Kindroid 的多層系統表現很強,雖然它的文件也承認長期召回「可能並不可靠」(Kindroid)。如果是一段漫長的故事,需要讓主線貫穿整個篇章都撐得住,那就是 Saga 為之打造的情境。對任何「什麼都記得住」的說法都要存疑,然後自己親手測一遍。
AI 聊天機器人能記住所有事情嗎? 字面上做不到,而且只要有人說做得到,你就不該輕信。除了上下文視窗的限制之外,記憶系統本身也會在萃取、更新與檢索這幾個階段捏造與遺失資訊(HaluMem)。一套好的系統能可靠地召回真正重要的事;它並不會儲存一份無限長、完美無缺、模型隨時想讀就能讀的逐字稿。
什麼是 lorebook? lorebook(也叫 World Info)是一組你親手撰寫、關於你的世界的條目,每一條都綁定一個觸發關鍵字,只有當那個詞出現在對話裡時,才會把這條條目注入(SillyTavern)。它在觸發時很精準,沒觸發時就一片沉默:只要你換句話說或把觸發字拼錯,這條條目就不會載入。在 Saga 裡,你來設定那套錨定世界的世界觀,所以正典是你定義出來的,而不是去指望模型自己推敲出來。
上下文視窗更大,就代表記憶更好嗎? 不是。更大的視窗在某個程度之前是有幫助的,再往上就會撞上「迷失在中間」——模型會弄丟埋在長提示主體裡的資訊;以及前攝干擾——舊文字會阻擋對較新文字的召回,直到檢索崩塌成捏造(Atlan、arXiv)。更多的 token 只是一個更大的乾草堆。記憶真正的關鍵,是找到那根對的針。
Saga 目前正處於預覽階段,所以你可以及早加入,幫忙形塑這套記憶實際用起來的樣子。
有問題,或想交流角色扮演的點子嗎?來 Discord 一起聊聊吧。上方的平台細節,反映的是截至 2026 年中為止公開報導的資訊;這些系統變動得很快,最新狀況請以原始連結為準。























