Replika 的帮助中心说它"会保留从一开始的全部内容"。但实际拆解出来是另一回事:模型每次其实只看得到最近大约 25 条消息,更早的全都躺在你的账号里,AI 在推理时根本读不到(thredly.io)。历史是存下来了,可它并没有被记住。问题的根子,就出在这道缝里。
如果你曾经告诉过一个角色你的名字、你的来历、你俩第一天一起定下的某件事,然后看着它在五十条消息之后一脸茫然,你就体会过这种感觉。聊天记录就明明白白地摆在你屏幕上,模型只是没在看它而已。
为什么 AI 角色会忘事
语言模型并不像你那样,对一段对话有一份持续运转的记忆。每一轮,它读取一块固定大小的文本,叫做上下文窗口,生成一段回复,然后就把"读过"这件事本身忘掉。这一轮塞不进窗口的东西,对它来说基本等于不存在。
随着一段对话越聊越长、超出窗口能装下的量,最早的文字就会被挤出去,给最新的内容腾地方。更大的窗口能换来更多空间,但它更贵、更慢,而且会在中间段掉链子:模型几乎必然会丢掉那些埋在长提示词开头和结尾之间的信息,这就是所谓"lost in the middle"效应(Atlan、bitfern)。所以忘事不是一个打个补丁就能修好的 bug,它是这套架构默认就会有的行为。下面讲的全部,都是在想办法绕开它。
AI 能"记住"的几种方式(以及每一种会在哪里掉链子)
每一套记忆系统,本质上都是一种策略:在恰当的时机,把恰当的旧文本重新塞回那个固定窗口里。每一种都在召回率、成本和延迟之间做取舍,并各自带着一种独有的翻车方式。
滚动式摘要。 让一个 LLM 把旧的对话轮次压缩成一份不断更新的摘要,随提示词一起带着走。它便宜又紧凑,但天生就是有损的:每压缩一遍,都会丢掉一些细节来保持简短。一条难得的"第一天"设定,挺过了第一次压缩,被第二次削薄,到第三次就彻底没了。你不会立刻察觉,直到某天角色推翻了你俩一周前一起定下的某件事(mem0、Recursively Summarizing, arXiv)。
lorebook / World Info。 你一条一条手写词条,每一条只在它的触发关键词出现在文本里时才被注入(SillyTavern 文档)。一旦触发,它非常精准。问题在于,AI 在被某个关键词唤醒之前,对自己的 lorebook 本来就是视而不见的:你把触发词换个说法、拼错,或者拐着弯提到那件事,词条就会悄无声息地永远加载不出来。知识是存在的,却一直隐形。
向量 / RAG 检索。 每条消息都被嵌入成一个向量存起来。每一轮,系统检索出与你刚说的话最相似的那些片段,再把它们贴进提示词(freeCodeCamp)。它能撑住海量的历史记录,这是它真正的强项。但它也会在"最相似"并不等于"最相关"的时候捞错片段,而一段被信心十足地检索出来的错误记忆,比没有记忆还糟:它给模型递上了一个可以继续往上盖的假前提。
多层 / 结构化记忆。 不是直接把原始文本一股脑塞进去,而是让一个 LLM 提取出关键事实,发出增、改、删操作,或者像 Generative Agents 那项研究那样,按新近程度、重要性和相关性给记忆打分(arXiv 综述、Generative Agents)。这更接近"记得"本该有的感觉。但它也多加了一个会出错的环节:HaluMem 这个基准测试表明,记忆系统会在提取、更新和检索这几个阶段凭空编造和丢失信息(HaluMem, arXiv)。记忆会幻觉,而不只是会忘。
知识图谱。 实体变成节点,关系变成边,再配上记录"某事何时发生"对比"某事何时被获知"的时序边(Zep / Graphiti 论文)。它是最结构化的方案,也是随着故事不断分叉、搭建和维护起来最费工夫的一个。
从这里能引出两件事。第一,这个取舍是真实而无法回避的:召回率、成本、延迟三者互相拉扯,再加上编造记忆的风险。第二,更大的上下文窗口并不等于一套记忆系统。过了某个点,旧信息反而会反过来妨碍对较新信息的召回("前摄干扰"),而在高干扰的情况下,检索不会平稳地退化,而是直接塌成编造(前摄干扰研究, arXiv)。更多的 token 只是把草垛堆得更大,并不会让那根针更好找。
各家平台是怎么处理的
简单说一说各家用的是什么招、又各自在哪里出岔子。表格里的格子是故意写得很紧凑的。
| 平台 | 它怎么记 | 它在哪里掉链子 |
|---|---|---|
| Character.AI | 置顶消息,外加会话之间的一段遗忘窗口 | 忘事和上下文腐烂是用户抱怨最多的两件事(404 Media) |
| AI Dungeon | 可编辑的 Story Summary,加上 Memory Bank 这层 RAG,以及关键词触发的 Story Cards(Latitude、帮助) | 记忆槽位按档位封顶、用得最少的会被挤掉;在精确关键词把它加载进来之前,AI 对一张 Story Card 是视而不见的(帮助) |
| SillyTavern | 全靠你手动把 World Info、Author's Note、Summarize 和 Vector Storage 一层层叠起来(World Info、Summarize) | 全程纯手动;带关键词的词条会漏掉不含关键词的说法;Summarize 的文档自己也警告输出会"漂移和幻觉" |
| Kindroid | 始终挂在上下文里的背景设定,加上可检索的长期记忆和一本关键短语日志(文档) | 文档承认长期记忆"可能不可靠";最深的那一层要付费;日志的关键短语必须逐字对上 |
| Nomi | 一张随着长历史慢慢积累起来的 Mind Map(Nomi) | 这张图要大约 500 条消息之后才成形,要稳定召回更是得 1,000 条以上;Identity Core 既看不到也改不了 |
| Replika | 账号宣称会保留从一开始的全部内容(thredly) | 模型只看得到最近约 25 条消息;其余的虽然存着,但在推理时是隐形的 |
| Saga | 在长篇故事里始终记得住;世界设定由你来定 | 仍在预览阶段,角色库还不大 |
这里头有几家值得多说一句。SpicyChat 把 lorebook 锁在付费档后面,还把免费档的上下文卡在 4,096 token,所以那里的记忆在任何技巧上场之前就已经很短了(SpicyChat 文档)。NovelAI 的 lorebook 同样靠关键词触发来激活词条(NovelAI 文档),跟其他所有家走的是同一套既精准又脆弱的路子。
那"管用的记忆"到底是什么意思?
注意一下这张表里没有的东西:一个"永远不忘"的平台。任何拿这个向你打包票的,都是在卖 Replika"保留全部内容"那套话术的营销版本。真正有用的问题要更具体一些。当故事越拉越长,恰恰是在别家的置顶记忆和长期记忆肉眼可见地崩掉的那个节点上,角色还记不记得住那些要紧的事?
这正是 Saga 想要跨过的那道坎。要紧的是体验本身:角色记得住一段长篇故事里发生过的事,会回头提起它,也会因为它而有所改变;而由你来定下那份给世界打底的设定,让 AI 从你设定的正典出发,而不是靠猜。更短、更随意的场景也照样玩得转。
有个测试你自己就能跑。先立下一个事实,往后玩 200 条消息,然后拐着弯提一下它,看角色还记不记得。那正是摘要开始丢细节、关键词 lorebook 一声不吭的时刻,也正是 Saga 为之而生的场景。除了记忆,其余的部分也都立得住:Saga 通过 OpenRouter 在多个模型之间调度,所以一旦某家供应商的质量下滑,你也不会被死死绑在它身上。内容边界由创作者自己定,只有一条不可动摇的硬线:绝不涉及未成年人。对话在传输过程中加密、安全存储,绝不出售,也绝不用于训练模型。它按 credits 计费,注册即送一批免费 credits,并计划提供自带密钥(BYOK)的选项,目前以候补名单的形式处于预览阶段。
如果你想把整个领域摸个大概,我们的 Character.AI 替代品指南把上面这些平台从价格、内容政策、各自适合谁的角度都梳理了一遍。
常见问题
为什么 Character.AI 什么都记不住? 它的模型每一轮只读取一个固定大小的上下文窗口,一旦对话长过了那个窗口,最早的文字就会被裁掉。长对话单纯是超出了模型一次能装下的量,而忘事和上下文腐烂正是用户最常见的抱怨之一(404 Media)。历史其实还存在你的账号里,只是模型没法一次全看到。
哪个 AI 角色扮演的记忆最好? 这要看你想干什么。如果是一个你每天都会回去找的伴侣型角色,Kindroid 的多层系统挺强,尽管它的文档也承认长期召回"可能不可靠"(Kindroid)。如果是一段需要让线索贯穿整条故事线的长篇故事,那正是 Saga 为之而生的场景。对任何"什么都记得住"的说法都留个心眼,然后自己去测。
AI 聊天机器人能记住所有东西吗? 字面意义上做不到,谁要这么跟你说,都别信。除了上下文窗口的限制之外,记忆系统本身也会在提取、更新和检索这几个阶段凭空编造和丢失信息(HaluMem)。一套好的系统会稳定地记住要紧的事,但它不会存下一份无限、完美、模型随时能读的逐字记录。
什么是 lorebook? lorebook(也叫 World Info)是一组你为自己的世界写下的词条,每一条都绑着一个触发关键词,只在那个词出现在对话里时才把这条词条注入进去(SillyTavern)。触发时它很精准,不触发时它就一声不吭:把触发词换个说法或者拼错,词条就永远加载不出来。在 Saga 里,由你来定下那份给世界打底的设定,于是正典是你亲手定义出来的,而不是指望模型去推断。
上下文窗口更大就意味着记忆更好吗? 不是。更大的窗口在一定限度内有帮助,过了那个点就会撞上"lost in the middle"——模型会丢掉埋在长提示词正文里的信息,还会撞上前摄干扰——旧文本会妨碍对较新文本的召回,直到检索塌成编造(Atlan、arXiv)。更多的 token 只是更大的草垛,而记忆要的是找到那根对的针。
Saga 现在正处于预览阶段,所以你可以早早进来,帮忙塑造这份记忆在实际用起来时到底是什么手感。
有问题,或者想交流角色扮演的点子?来 Discord 一起玩。上文中的平台细节反映的是截至 2026 年年中公开报道的情况;这些系统变化很快,最新信息请以来源链接为准。























