AI 角色扮演的记忆：为什么你的角色总是忘事（以及什么才真正管用）

Replika 的帮助中心说它"会保留从一开始的全部内容"。但实际拆解出来是另一回事：模型每次其实只看得到最近大约 25 条消息，更早的全都躺在你的账号里，AI 在推理时根本读不到（thredly.io）。历史是存下来了，可它并没有被记住。问题的根子，就出在这道缝里。

如果你曾经告诉过一个角色你的名字、你的来历、你俩第一天一起定下的某件事，然后看着它在五十条消息之后一脸茫然，你就体会过这种感觉。聊天记录就明明白白地摆在你屏幕上，模型只是没在看它而已。

为什么 AI 角色会忘事

语言模型并不像你那样，对一段对话有一份持续运转的记忆。每一轮，它读取一块固定大小的文本，叫做上下文窗口，生成一段回复，然后就把"读过"这件事本身忘掉。这一轮塞不进窗口的东西，对它来说基本等于不存在。

随着一段对话越聊越长、超出窗口能装下的量，最早的文字就会被挤出去，给最新的内容腾地方。更大的窗口能换来更多空间，但它更贵、更慢，而且会在中间段掉链子：模型几乎必然会丢掉那些埋在长提示词开头和结尾之间的信息，这就是所谓"lost in the middle"效应（Atlan、bitfern）。所以忘事不是一个打个补丁就能修好的 bug，它是这套架构默认就会有的行为。下面讲的全部，都是在想办法绕开它。

AI 能"记住"的几种方式（以及每一种会在哪里掉链子）

每一套记忆系统，本质上都是一种策略：在恰当的时机，把恰当的旧文本重新塞回那个固定窗口里。每一种都在召回率、成本和延迟之间做取舍，并各自带着一种独有的翻车方式。

滚动式摘要。 让一个 LLM 把旧的对话轮次压缩成一份不断更新的摘要，随提示词一起带着走。它便宜又紧凑，但天生就是有损的：每压缩一遍，都会丢掉一些细节来保持简短。一条难得的"第一天"设定，挺过了第一次压缩，被第二次削薄，到第三次就彻底没了。你不会立刻察觉，直到某天角色推翻了你俩一周前一起定下的某件事（mem0、Recursively Summarizing, arXiv）。

lorebook / World Info。 你一条一条手写词条，每一条只在它的触发关键词出现在文本里时才被注入（SillyTavern 文档）。一旦触发，它非常精准。问题在于，AI 在被某个关键词唤醒之前，对自己的 lorebook 本来就是视而不见的：你把触发词换个说法、拼错，或者拐着弯提到那件事，词条就会悄无声息地永远加载不出来。知识是存在的，却一直隐形。

向量 / RAG 检索。 每条消息都被嵌入成一个向量存起来。每一轮，系统检索出与你刚说的话最相似的那些片段，再把它们贴进提示词（freeCodeCamp）。它能撑住海量的历史记录，这是它真正的强项。但它也会在"最相似"并不等于"最相关"的时候捞错片段，而一段被信心十足地检索出来的错误记忆，比没有记忆还糟：它给模型递上了一个可以继续往上盖的假前提。

多层 / 结构化记忆。 不是直接把原始文本一股脑塞进去，而是让一个 LLM 提取出关键事实，发出增、改、删操作，或者像 Generative Agents 那项研究那样，按新近程度、重要性和相关性给记忆打分（arXiv 综述、Generative Agents）。这更接近"记得"本该有的感觉。但它也多加了一个会出错的环节：HaluMem 这个基准测试表明，记忆系统会在提取、更新和检索这几个阶段凭空编造和丢失信息（HaluMem, arXiv）。记忆会幻觉，而不只是会忘。

知识图谱。 实体变成节点，关系变成边，再配上记录"某事何时发生"对比"某事何时被获知"的时序边（Zep / Graphiti 论文）。它是最结构化的方案，也是随着故事不断分叉、搭建和维护起来最费工夫的一个。

从这里能引出两件事。第一，这个取舍是真实而无法回避的：召回率、成本、延迟三者互相拉扯，再加上编造记忆的风险。第二，更大的上下文窗口并不等于一套记忆系统。过了某个点，旧信息反而会反过来妨碍对较新信息的召回（"前摄干扰"），而在高干扰的情况下，检索不会平稳地退化，而是直接塌成编造（前摄干扰研究, arXiv）。更多的 token 只是把草垛堆得更大，并不会让那根针更好找。

各家平台是怎么处理的

简单说一说各家用的是什么招、又各自在哪里出岔子。表格里的格子是故意写得很紧凑的。

平台	它怎么记	它在哪里掉链子
Character.AI	置顶消息，外加会话之间的一段遗忘窗口	忘事和上下文腐烂是用户抱怨最多的两件事（404 Media）
AI Dungeon	可编辑的 Story Summary，加上 Memory Bank 这层 RAG，以及关键词触发的 Story Cards（Latitude、帮助）	记忆槽位按档位封顶、用得最少的会被挤掉；在精确关键词把它加载进来之前，AI 对一张 Story Card 是视而不见的（帮助）
SillyTavern	全靠你手动把 World Info、Author's Note、Summarize 和 Vector Storage 一层层叠起来（World Info、Summarize）	全程纯手动；带关键词的词条会漏掉不含关键词的说法；Summarize 的文档自己也警告输出会"漂移和幻觉"
Kindroid	始终挂在上下文里的背景设定，加上可检索的长期记忆和一本关键短语日志（文档）	文档承认长期记忆"可能不可靠"；最深的那一层要付费；日志的关键短语必须逐字对上
Nomi	一张随着长历史慢慢积累起来的 Mind Map（Nomi）	这张图要大约 500 条消息之后才成形，要稳定召回更是得 1,000 条以上；Identity Core 既看不到也改不了
Replika	账号宣称会保留从一开始的全部内容（thredly）	模型只看得到最近约 25 条消息；其余的虽然存着，但在推理时是隐形的
Saga	在长篇故事里始终记得住；世界设定由你来定	仍在预览阶段，角色库还不大

这里头有几家值得多说一句。SpicyChat 把 lorebook 锁在付费档后面，还把免费档的上下文卡在 4,096 token，所以那里的记忆在任何技巧上场之前就已经很短了（SpicyChat 文档）。NovelAI 的 lorebook 同样靠关键词触发来激活词条（NovelAI 文档），跟其他所有家走的是同一套既精准又脆弱的路子。

那"管用的记忆"到底是什么意思？

注意一下这张表里没有的东西：一个"永远不忘"的平台。任何拿这个向你打包票的，都是在卖 Replika"保留全部内容"那套话术的营销版本。真正有用的问题要更具体一些。当故事越拉越长，恰恰是在别家的置顶记忆和长期记忆肉眼可见地崩掉的那个节点上，角色还记不记得住那些要紧的事？

这正是 Saga 想要跨过的那道坎。要紧的是体验本身：角色记得住一段长篇故事里发生过的事，会回头提起它，也会因为它而有所改变；而由你来定下那份给世界打底的设定，让 AI 从你设定的正典出发，而不是靠猜。更短、更随意的场景也照样玩得转。

有个测试你自己就能跑。先立下一个事实，往后玩 200 条消息，然后拐着弯提一下它，看角色还记不记得。那正是摘要开始丢细节、关键词 lorebook 一声不吭的时刻，也正是 Saga 为之而生的场景。除了记忆，其余的部分也都立得住：Saga 通过 OpenRouter 在多个模型之间调度，所以一旦某家供应商的质量下滑，你也不会被死死绑在它身上。内容边界由创作者自己定，只有一条不可动摇的硬线：绝不涉及未成年人。对话在传输过程中加密、安全存储，绝不出售，也绝不用于训练模型。它按 credits 计费，注册即送一批免费 credits，并计划提供自带密钥（BYOK）的选项，目前以候补名单的形式处于预览阶段。

如果你想把整个领域摸个大概，我们的 Character.AI 替代品指南把上面这些平台从价格、内容政策、各自适合谁的角度都梳理了一遍。

常见问题

为什么 Character.AI 什么都记不住？ 它的模型每一轮只读取一个固定大小的上下文窗口，一旦对话长过了那个窗口，最早的文字就会被裁掉。长对话单纯是超出了模型一次能装下的量，而忘事和上下文腐烂正是用户最常见的抱怨之一（404 Media）。历史其实还存在你的账号里，只是模型没法一次全看到。

哪个 AI 角色扮演的记忆最好？ 这要看你想干什么。如果是一个你每天都会回去找的伴侣型角色，Kindroid 的多层系统挺强，尽管它的文档也承认长期召回"可能不可靠"（Kindroid）。如果是一段需要让线索贯穿整条故事线的长篇故事，那正是 Saga 为之而生的场景。对任何"什么都记得住"的说法都留个心眼，然后自己去测。

AI 聊天机器人能记住所有东西吗？ 字面意义上做不到，谁要这么跟你说，都别信。除了上下文窗口的限制之外，记忆系统本身也会在提取、更新和检索这几个阶段凭空编造和丢失信息（HaluMem）。一套好的系统会稳定地记住要紧的事，但它不会存下一份无限、完美、模型随时能读的逐字记录。

什么是 lorebook？ lorebook（也叫 World Info）是一组你为自己的世界写下的词条，每一条都绑着一个触发关键词，只在那个词出现在对话里时才把这条词条注入进去（SillyTavern）。触发时它很精准，不触发时它就一声不吭：把触发词换个说法或者拼错，词条就永远加载不出来。在 Saga 里，由你来定下那份给世界打底的设定，于是正典是你亲手定义出来的，而不是指望模型去推断。

上下文窗口更大就意味着记忆更好吗？ 不是。更大的窗口在一定限度内有帮助，过了那个点就会撞上"lost in the middle"——模型会丢掉埋在长提示词正文里的信息，还会撞上前摄干扰——旧文本会妨碍对较新文本的召回，直到检索塌成编造（Atlan、arXiv）。更多的 token 只是更大的草垛，而记忆要的是找到那根对的针。

Saga 现在正处于预览阶段，所以你可以早早进来，帮忙塑造这份记忆在实际用起来时到底是什么手感。

加入 Saga 候补名单 →

有问题，或者想交流角色扮演的点子？来 Discord 一起玩。上文中的平台细节反映的是截至 2026 年年中公开报道的情况；这些系统变化很快，最新信息请以来源链接为准。

为什么 AI 角色会忘事

AI 能"记住"的几种方式（以及每一种会在哪里掉链子）

各家平台是怎么处理的

简单说一说各家用的是什么招、又各自在哪里出岔子。表格里的格子是故意写得很紧凑的。

平台	它怎么记	它在哪里掉链子
Character.AI	置顶消息，外加会话之间的一段遗忘窗口	忘事和上下文腐烂是用户抱怨最多的两件事（404 Media）
AI Dungeon	可编辑的 Story Summary，加上 Memory Bank 这层 RAG，以及关键词触发的 Story Cards（Latitude、帮助）	记忆槽位按档位封顶、用得最少的会被挤掉；在精确关键词把它加载进来之前，AI 对一张 Story Card 是视而不见的（帮助）
SillyTavern	全靠你手动把 World Info、Author's Note、Summarize 和 Vector Storage 一层层叠起来（World Info、Summarize）	全程纯手动；带关键词的词条会漏掉不含关键词的说法；Summarize 的文档自己也警告输出会"漂移和幻觉"
Kindroid	始终挂在上下文里的背景设定，加上可检索的长期记忆和一本关键短语日志（文档）	文档承认长期记忆"可能不可靠"；最深的那一层要付费；日志的关键短语必须逐字对上
Nomi	一张随着长历史慢慢积累起来的 Mind Map（Nomi）	这张图要大约 500 条消息之后才成形，要稳定召回更是得 1,000 条以上；Identity Core 既看不到也改不了
Replika	账号宣称会保留从一开始的全部内容（thredly）	模型只看得到最近约 25 条消息；其余的虽然存着，但在推理时是隐形的
Saga	在长篇故事里始终记得住；世界设定由你来定	仍在预览阶段，角色库还不大

那"管用的记忆"到底是什么意思？

如果你想把整个领域摸个大概，我们的 Character.AI 替代品指南把上面这些平台从价格、内容政策、各自适合谁的角度都梳理了一遍。

常见问题

Saga 现在正处于预览阶段，所以你可以早早进来，帮忙塑造这份记忆在实际用起来时到底是什么手感。

加入 Saga 候补名单 →

AI 角色扮演的记忆：为什么你的角色总是忘事（以及什么才真正管用）

为什么 AI 角色会忘事

AI 能"记住"的几种方式（以及每一种会在哪里掉链子）

各家平台是怎么处理的

那"管用的记忆"到底是什么意思？

常见问题

你的传奇在等你。

AI 角色扮演的记忆：为什么你的角色总是忘事（以及什么才真正管用）

为什么 AI 角色会忘事

AI 能"记住"的几种方式（以及每一种会在哪里掉链子）

各家平台是怎么处理的

那"管用的记忆"到底是什么意思？

常见问题