AI 角色扮演的記憶：你的角色為什麼會忘記（以及什麼才真正有用）

Replika 的官方說明中心宣稱它「會保留從一開始到現在的所有內容」。但拆解分析說的卻是另一回事：模型其實只看得到大約最後 25 則訊息，再早的全都躺在你的帳號裡，AI 在推論當下根本讀不到（thredly.io）。歷史紀錄是存下來了，卻沒有被記住。問題的全部癥結，就在這道落差。

如果你曾經告訴某個角色你的名字、你的背景故事、你們在第一天一起決定的某件事，然後看著它在五十則訊息之後一臉茫然，你就親身體會過這種感覺。聊天紀錄明明就在你的螢幕上，模型只是沒在看而已。

AI 角色為什麼會忘記

語言模型並不像你一樣，對整段對話保有一份持續更新的記憶。每一個回合，它都會讀進一塊固定大小的文字，這塊文字叫做「上下文視窗」（context window），生成一段回覆，然後就忘了自己曾經讀過。任何塞不進這一回合視窗的內容，等於不存在。

當一段對話成長到超出視窗能容納的範圍，最舊的文字就會被擠出去，好騰出空間給最新的內容。更大的視窗能換來更多空間，但代價是更貴、延遲更高，而且中段會劣化：模型在面對長提示時，總是會弄丟夾在開頭和結尾之間的資訊，這就是所謂「迷失在中間」（lost in the middle）的效應（Atlan、bitfern）。所以遺忘並不是一個修一修就能解決的 bug，它是這套架構的預設行為。下面所有的內容，都是想方設法繞過它的嘗試。

AI 能「記住」的各種方式（以及每一種怎麼失靈）

每一套記憶系統，本質上都是一種策略：在對的時機，把對的舊文字重新塞回那個固定的視窗裡。每一種都在「召回率」與「成本、延遲」之間做取捨，而且各自帶著一種專屬的失靈模式。

滾動式摘要（Rolling summarization）。 由一個 LLM 把舊的對話回合壓縮成一份持續更新的摘要，跟著提示一起送進去。它便宜又精簡，但天生就是有損的：每壓縮一次，都會為了保持簡短而丟掉一些細節。某個只在第一天提過一次的事實，撐過了第一次壓縮，第二次被稀釋，到第三次就徹底消失了。你不會立刻察覺，直到角色開始牴觸某件你們一週前才一起確立的事（mem0、Recursively Summarizing, arXiv）。

Lorebook／World Info。 你親手寫下一條條的條目，每一條只有在它的觸發關鍵字出現在文字裡時，才會被注入（SillyTavern 文件）。一旦觸發，它非常精準。問題在於 AI 對自己的 lorebook 預設是看不見的，非得等某個關鍵字把對應條目喚醒才行：只要你換句話說、把觸發字拼錯，或是用拐個彎的方式提到那件事，這條條目就會默默地永遠不載入。知識明明存在，卻始終看不見。

向量／RAG 檢索。 每一則訊息都會被轉成向量（embedding）並儲存起來。每個回合，系統會檢索出和你剛剛所說最相似的片段，再把它們貼進去（freeCodeCamp）。它能擴展到龐大的歷史紀錄，這正是它真正的強項。但它也會在「最相似」不等於「最相關」時撈出錯誤的片段，而一段被自信地檢索出來的錯誤記憶，比完全沒有記憶還糟：它等於餵給模型一個錯誤的前提，讓模型在上面繼續蓋下去。

多層／結構化記憶（Multi-layer / structured memory）。 與其直接傾倒原始文字，不如由一個 LLM 萃取出重要事實，並發出新增、更新、刪除等操作；或是像當年 Generative Agents 那項研究所做的那樣，依「新近度、重要性、相關性」為記憶評分（arXiv 綜述、Generative Agents）。這已經比較接近「記憶」應該有的感覺了。但它也多出了一個可能出錯的步驟：HaluMem 這項基準測試顯示，記憶系統會在萃取、更新與檢索這幾個階段捏造與遺失資訊（HaluMem, arXiv）。記憶會產生幻覺，它不只是會遺忘而已。

知識圖譜（Knowledge graphs）。 實體變成節點，關係變成邊，再用帶時間性的邊去追蹤某件事「是什麼時候發生的」相對於「是什麼時候被學到的」（Zep / Graphiti 論文）。它是結構化程度最高的選項，但隨著故事不斷分岔，要把它建起來並維持乾淨，工程量也最大。

從這裡可以得出兩件事。第一，這個取捨是真實而無法迴避的：召回率，對上成本，對上延遲，對上捏造記憶的風險。第二，更大的上下文視窗並不是一套記憶系統。超過某個臨界點之後，舊資訊反而會主動阻擋對較新資訊的召回（這叫「前攝干擾」，proactive interference），而在高度干擾下，檢索不會優雅地逐步退化，而是直接崩塌成捏造（前攝干擾研究, arXiv）。更多的 token，只是更大的乾草堆，而不是一根更好的針。

各家平台怎麼處理這件事

以下簡短說明誰負責什麼、又各自在哪裡裂開。表格裡的內容是刻意寫得很精簡的。

平台	它如何記憶	它在哪裡失靈
Character.AI	釘選訊息，再加上一個換到別段對話就會遺忘的視窗	遺忘與上下文腐化（context rot）是用戶抱怨榜上的前幾名（404 Media）
AI Dungeon	可編輯的 Story Summary，再加上一層 Memory Bank RAG 與關鍵字 Story Cards（Latitude、說明）	記憶槽位依方案分級設上限，並採「最少使用優先汰除」；在精確關鍵字載入之前，AI 對某張 Story Card 是看不見的（說明）
SillyTavern	你親手把 World Info、Author's Note、Summarize 與 Vector Storage 一層層疊起來（World Info、Summarize）	全靠手動；以關鍵字綁定的條目會錯過沒踩中關鍵字的說法；Summarize 文件本身就警告輸出會「漂移與產生幻覺」
Kindroid	永遠在上下文裡的背景故事，加上可檢索的長期記憶與一份關鍵字日誌（文件）	文件坦承長期記憶「可能並不可靠」；最深的層級要付費；日誌關鍵字必須逐字相符
Nomi	一張會隨著漫長歷史逐步建立起來的 Mind Map（Nomi）	這張圖要累積約 500 則訊息之後才會成形，而可靠的召回更要綁到 1,000 則以上；Identity Core 既不能查看也不能編輯
Replika	帳號宣稱會保留從一開始到現在的所有內容（thredly）	模型其實只看得到約 25 則最近的訊息；其餘的雖有儲存，在推論當下卻看不見
Saga	能在漫長故事裡記得住；世界觀設定由你來定	在預覽階段，作品庫仍然偏少

其中有幾家值得各補一句。SpicyChat 把 lorebook 鎖在付費方案後面，並把免費方案的上下文上限壓在 4,096 個 token，所以在任何技巧派上用場之前，那裡的記憶本身就已經很短了（SpicyChat 文件）。NovelAI 的 lorebook 則是靠關鍵字觸發來啟動條目（NovelAI 文件），跟其他所有人一樣，是同一套既精準又脆弱的模式。

那麼，「真正管用的記憶」到底是什麼意思？

注意一下這張表格裡沒有的東西：沒有任何一個平台是「永遠不會忘記」的。任何向你保證這一點的人，賣給你的不過是 Replika 那句「保留所有內容」的行銷版本。真正有用的問題其實更窄：就在別處那些釘選與持久記憶會明顯崩掉的同一個關卡，當故事拉長之後，角色是不是還記得真正重要的事？

而跨過那道門檻，正是 Saga 打造出來要做的事。重點在於體驗：角色會記住一段漫長故事裡發生過的事，會回頭呼應它，也會因為它而改變；而你來設定那套錨定整個世界的世界觀，讓 AI 是依照你的正典（canon）在運作，而不是自己用猜的。比較短、比較輕鬆的場景，一樣放得進來。

有一個你可以自己跑跑看的測試。先確立一件事實，然後往後玩 200 則訊息，再用拐個彎的方式提到它，看看角色是不是還記得。那正是摘要會把細節丟掉、而關鍵字 lorebook 會保持沉默的那一刻，也正是 Saga 為之打造的那種情境。在記憶之外，其餘的環節也站得住腳：Saga 會透過 OpenRouter 在多個模型之間路由，所以萬一某家供應商的品質下滑，你也不會被綁死在它身上。內容界線由創作者自己設定，只有一條不會移動的硬底線：絕不涉及未成年人。對話在傳輸過程中加密、安全儲存，絕不出售，也絕不用來訓練模型。它採點數（credits）制，一開始會送你免費點數，自備金鑰（bring-your-own-key）的選項也在規劃中；目前則處於預覽階段，採候補名單制。

如果你想盤點更大的版圖，我們這篇Character.AI 替代方案指南，會從價格、內容政策，以及各自適合誰這幾個角度，把上面這些平台一一講過。

常見問題

Character.AI 為什麼什麼都記不住？ 它的模型每個回合都讀一塊固定的上下文視窗，一旦對話長到超出那個視窗，最舊的文字就會被裁掉。長對話純粹就是超過了模型一次能容納的量，而遺忘與上下文腐化也正是最常見的抱怨之一（404 Media）。歷史紀錄其實還存在你的帳號裡，只是模型沒辦法一次全部看到而已。

哪一個 AI 角色扮演的記憶最好？ 這要看你在做什麼。如果是一個你每天都會回去找的夥伴，Kindroid 的多層系統表現很強，雖然它的文件也承認長期召回「可能並不可靠」（Kindroid）。如果是一段漫長的故事，需要讓主線貫穿整個篇章都撐得住，那就是 Saga 為之打造的情境。對任何「什麼都記得住」的說法都要存疑，然後自己親手測一遍。

AI 聊天機器人能記住所有事情嗎？ 字面上做不到，而且只要有人說做得到，你就不該輕信。除了上下文視窗的限制之外，記憶系統本身也會在萃取、更新與檢索這幾個階段捏造與遺失資訊（HaluMem）。一套好的系統能可靠地召回真正重要的事；它並不會儲存一份無限長、完美無缺、模型隨時想讀就能讀的逐字稿。

什麼是 lorebook？ lorebook（也叫 World Info）是一組你親手撰寫、關於你的世界的條目，每一條都綁定一個觸發關鍵字，只有當那個詞出現在對話裡時，才會把這條條目注入（SillyTavern）。它在觸發時很精準，沒觸發時就一片沉默：只要你換句話說或把觸發字拼錯，這條條目就不會載入。在 Saga 裡，你來設定那套錨定世界的世界觀，所以正典是你定義出來的，而不是去指望模型自己推敲出來。

上下文視窗更大，就代表記憶更好嗎？ 不是。更大的視窗在某個程度之前是有幫助的，再往上就會撞上「迷失在中間」——模型會弄丟埋在長提示主體裡的資訊；以及前攝干擾——舊文字會阻擋對較新文字的召回，直到檢索崩塌成捏造（Atlan、arXiv）。更多的 token 只是一個更大的乾草堆。記憶真正的關鍵，是找到那根對的針。

Saga 目前正處於預覽階段，所以你可以及早加入，幫忙形塑這套記憶實際用起來的樣子。

加入 Saga 候補名單 →

有問題，或想交流角色扮演的點子嗎？來 Discord 一起聊聊吧。上方的平台細節，反映的是截至 2026 年中為止公開報導的資訊；這些系統變動得很快，最新狀況請以原始連結為準。

AI 角色為什麼會忘記

AI 能「記住」的各種方式（以及每一種怎麼失靈）

各家平台怎麼處理這件事

以下簡短說明誰負責什麼、又各自在哪裡裂開。表格裡的內容是刻意寫得很精簡的。

平台	它如何記憶	它在哪裡失靈
Character.AI	釘選訊息，再加上一個換到別段對話就會遺忘的視窗	遺忘與上下文腐化（context rot）是用戶抱怨榜上的前幾名（404 Media）
AI Dungeon	可編輯的 Story Summary，再加上一層 Memory Bank RAG 與關鍵字 Story Cards（Latitude、說明）	記憶槽位依方案分級設上限，並採「最少使用優先汰除」；在精確關鍵字載入之前，AI 對某張 Story Card 是看不見的（說明）
SillyTavern	你親手把 World Info、Author's Note、Summarize 與 Vector Storage 一層層疊起來（World Info、Summarize）	全靠手動；以關鍵字綁定的條目會錯過沒踩中關鍵字的說法；Summarize 文件本身就警告輸出會「漂移與產生幻覺」
Kindroid	永遠在上下文裡的背景故事，加上可檢索的長期記憶與一份關鍵字日誌（文件）	文件坦承長期記憶「可能並不可靠」；最深的層級要付費；日誌關鍵字必須逐字相符
Nomi	一張會隨著漫長歷史逐步建立起來的 Mind Map（Nomi）	這張圖要累積約 500 則訊息之後才會成形，而可靠的召回更要綁到 1,000 則以上；Identity Core 既不能查看也不能編輯
Replika	帳號宣稱會保留從一開始到現在的所有內容（thredly）	模型其實只看得到約 25 則最近的訊息；其餘的雖有儲存，在推論當下卻看不見
Saga	能在漫長故事裡記得住；世界觀設定由你來定	在預覽階段，作品庫仍然偏少

那麼，「真正管用的記憶」到底是什麼意思？

如果你想盤點更大的版圖，我們這篇Character.AI 替代方案指南，會從價格、內容政策，以及各自適合誰這幾個角度，把上面這些平台一一講過。

常見問題

Saga 目前正處於預覽階段，所以你可以及早加入，幫忙形塑這套記憶實際用起來的樣子。

加入 Saga 候補名單 →

AI 角色扮演的記憶：你的角色為什麼會忘記（以及什麼才真正有用）

AI 角色為什麼會忘記

AI 能「記住」的各種方式（以及每一種怎麼失靈）

各家平台怎麼處理這件事

那麼，「真正管用的記憶」到底是什麼意思？

常見問題

你的 Saga 正在等著你。

AI 角色扮演的記憶：你的角色為什麼會忘記（以及什麼才真正有用）

AI 角色為什麼會忘記

AI 能「記住」的各種方式（以及每一種怎麼失靈）

各家平台怎麼處理這件事

那麼，「真正管用的記憶」到底是什麼意思？

常見問題