Replikaのヘルプセンターは「最初からのすべてを保持している」と謳っています。ところが検証レポートはまったく別の話を伝えています。モデルが実際に見ているのは直近25メッセージ程度だけで、それより古いものはアカウントの中に残ったまま、推論時にはAIから読めない場所に置かれているのです(thredly.io)。履歴は保存されている。でも、記憶されてはいない。このズレこそが問題のすべてです。
キャラクターに自分の名前や生い立ち、初日に二人で決めた約束ごとを伝えたのに、50メッセージ後にはきょとんとされた――そんな経験があるなら、あなたはもうこれを体感しています。チャットログは画面にちゃんと表示されている。ただ、モデルがそれを見ていないだけなのです。
なぜAIキャラクターは忘れるのか
言語モデルは、人間のように会話の流れをずっと覚えているわけではありません。1ターンごとに、コンテキストウィンドウと呼ばれる固定サイズのテキストの塊を読み、返答を生成し、そして「読んだ」という行為そのものを忘れます。そのターンでウィンドウに収まらなかったものは、存在しないのと同じです。
チャットがウィンドウの容量を超えて伸びていくと、いちばん古いテキストが押し出され、いちばん新しいもののための場所が空けられます。ウィンドウを大きくすればその分の余裕は買えますが、コストはかさみ、レイテンシは増え、しかも真ん中で性能が落ちます。モデルは長いプロンプトの先頭と末尾のあいだに埋もれた情報を高い確率で見失う――いわゆる「lost in the middle」現象です(Atlan、bitfern)。つまり、忘れることはパッチひとつで直るバグではありません。それはこのアーキテクチャの既定の振る舞いなのです。以下に挙げるのは、すべてそれを何とか回避しようとする試みです。
AIが「記憶する」やり方いろいろ(と、それぞれの破綻のしかた)
どのメモリ方式も、正しい古いテキストを正しいタイミングであの固定ウィンドウに戻すための戦略です。そしてどれもが、想起の精度をコスト・レイテンシ・そして方式ごとの固有の失敗パターンと引き換えにしています。
逐次要約(rolling summarization)。 LLMが古いやりとりを、プロンプトに同乗していく要約へと圧縮します。安上がりでコンパクトですが、設計上どうしても情報が欠落します。要約を重ねるたびに、短く保つために細部が捨てられていくからです。初日の貴重な事実は一度目の圧縮を生き延び、二度目で薄まり、三度目には消えています。そして一週間前に二人で決めたはずのことにキャラクターが矛盾するまで、あなたはそれに気づきません(mem0、Recursively Summarizing, arXiv)。
ロアブック(lorebook)/World Info。 自分で手作業でエントリを書き、各エントリは対応するトリガーキーワードが文中に現れたときだけ注入されます(SillyTavern docs)。発火すれば正確です。問題は、AIが自分のロアブックを普段は読めないようになっていて、キーワードが呼び出すまで見えないこと。トリガーを言い換えたり、タイプミスしたり、遠回しに触れたりすると、そのエントリは何のエラーも出さずに読み込まれません。知識は存在しているのに、見えないままなのです。
ベクトル/RAG検索。 すべてのメッセージがベクトルとして埋め込まれ、保存されます。1ターンごとに、システムはあなたが今言ったことに最も似たスニペットを取り出し、貼り付けます(freeCodeCamp)。これは膨大な履歴にもスケールするのが本当の強みです。一方で、「最も似ている」が「最も関連がある」とは限らないとき、間違ったスニペットを引き当ててしまいます。そして自信たっぷりに取り出された間違った記憶は、何もないよりタチが悪い。モデルに偽の前提を渡して、その上に話を積み上げさせてしまうからです。
多層/構造化メモリ。 生のテキストをそのまま放り込むのではなく、LLMが重要な事実を抽出し、追加・更新・削除といった操作を発行したり、あるいはGenerative Agentsの研究がやったように、記憶を新しさ・重要度・関連度でスコア付けしたりします(arXiv survey、Generative Agents)。これは「記憶」と聞いて本来思い浮かべるものにいちばん近い。ただし、失敗しうるステップが増えます。HaluMemベンチマークは、メモリシステムが抽出・更新・検索の各段階で情報をでっち上げたり失ったりすることを示しています(HaluMem, arXiv)。記憶はハルシネーション(捏造)を起こす。ただ忘れるだけではないのです。
ナレッジグラフ(knowledge graph)。 エンティティがノードに、関係がエッジになり、何かが起きた時点と、それが学習された時点とを別々に追う時間的エッジを持ちます(Zep / Graphiti paper)。最も構造化された選択肢であり、物語が枝分かれしていくなかでこれを構築し、きれいに保ち続けるのに最も手間がかかる選択肢でもあります。
ここから2つのことが見えてきます。第一に、トレードオフは現実であり、避けられません。想起の精度 対 コスト 対 レイテンシ 対 記憶を捏造するリスク。第二に、コンテキストウィンドウを大きくすることはメモリシステムではない、ということ。ある点を超えると、古い情報がむしろ新しい情報の想起を積極的に妨げ(「順向干渉(proactive interference)」)、干渉が強くなると、検索はなだらかに劣化するのではなく捏造へと崩れ落ちます(proactive interference study, arXiv)。トークンを増やすのは干し草の山を大きくすることであって、針を見つけやすくすることではありません。
各プラットフォームの対処法
どのサービスが何をやっていて、どこでほころびが出るのか、その短いまとめです。各セルはあえて簡潔にまとめています。
| Platform | How it remembers | Where it breaks |
|---|---|---|
| Character.AI | ピン留めメッセージ+セッション間の忘却ウィンドウ | 忘れることとコンテキストの劣化がユーザーの不満の筆頭格(404 Media) |
| AI Dungeon | 編集可能なStory Summary+Memory BankのRAG層+キーワード式Story Cards(Latitude、help) | メモリ枠はプラン別に上限があり、使用頻度の低いものから追い出される。AIは正確なキーワードが読み込まれるまでStory Cardが見えない(help) |
| SillyTavern | World Info、Author's Note、Summarize、Vector Storageを自分で手作業で積み上げる(World Info、Summarize) | 完全に手動。キー付きエントリはキーワード外の言い回しを取りこぼす。Summarizeのドキュメント自身が出力は「ドリフトしハルシネーションを起こす」と警告 |
| Kindroid | 常時コンテキスト内の背景設定+検索可能な長期記憶+キーフレーズ式ジャーナル(docs) | ドキュメントが長期記憶は「信頼できない可能性がある」と認めている。最深層は有料。ジャーナルのキーフレーズは一字一句一致が必要 |
| Nomi | 長い履歴を通して積み上がっていくMind Map(Nomi) | マップは約500メッセージ後にようやく形になり、信頼できる想起は1,000メッセージ以上が目安。Identity Coreは閲覧も編集もできない |
| Replika | アカウントは最初からのすべてを保持していると主張(thredly) | モデルが見ているのは直近25メッセージ程度のみ。残りは保存されているが推論時には見えない |
| Saga | 長い物語を通して保持する。ロアは自分で設定する | プレビュー中につき、ライブラリはまだ小さい |
このうちいくつかには一言添える価値があります。SpicyChatはロアブックを有料プランの裏に置き、無料プランのコンテキストを4,096トークンに制限しているため、どんなテクニックを使う以前に、そもそも記憶が短いのです(SpicyChat docs)。NovelAIのロアブックはキーワードのトリガーでエントリを発火させますが(NovelAI docs)、これは他のどれとも同じく、正確だが脆いパターンです。
では「ちゃんと効く記憶」とは結局どういう意味なのか
この表に載っていないものに注目してください。「絶対に忘れない」プラットフォームです。それを約束してくる相手は、Replikaの「すべてを保持」のマーケティング版をあなたに売りつけているのです。本当に役立つ問いは、もっと範囲が狭いものです。物語が長くなっていったとき、ほかのサービスのピン留め記憶や永続記憶が目に見えて壊れるまさにその場所で、キャラクターは大事なことをちゃんと覚えていられるか――そこが問題です。
それがSagaがクリアすべく作られているハードルです。大事なのは体験です。キャラクターが長い物語を通して起きたことを覚えていて、それを引き合いに出し、それによって変化していく。そしてあなたが世界を支えるロアを設定するので、AIは当て推量ではなく、あなたの正史(カノン)に基づいて動きます。もっと短い、気軽なシーンも同じようにしっくりはまります。
自分で試せるテストがあります。ある事実を決めて、そこから200メッセージ分プレイしてから、それを遠回しに参照して、キャラクターがまだ覚えているか見てみる。そこが要約が細部を落とし、キーワード式ロアブックが沈黙する瞬間であり、まさにSagaが作られているケースです。記憶まわりだけでなく、ほかの部分もきちんと作り込まれています。SagaはOpenRouterを通じて複数のモデルにルーティングするので、あるプロバイダーの品質が落ちても、ひとつに縛られることはありません。コンテンツの境界はクリエイターが設定しますが、絶対に動かさないハードラインがひとつあります。未成年に関わるものは一切なし、です。会話は通信時に暗号化され、安全に保存され、決して販売されず、モデルの訓練にも決して使われません。動作はクレジット制で、最初に使える無料クレジットがあり、自前のキーを持ち込めるオプションも予定しています。現在はウェイトリスト形式のプレビュー中です。
この分野全体を俯瞰したいなら、Character.AIの代替サービスガイドで、上に挙げたプラットフォームを価格・コンテンツ方針・どんな人に向いているかの観点から扱っています。
よくある質問
Character.AIはなぜ何もかも忘れてしまうのですか? モデルが1ターンごとに固定サイズのコンテキストウィンドウを読み、チャットがそのウィンドウを超えて大きくなると、いちばん古いテキストが切り詰められるからです。長いチャットは単純に、モデルが一度に保持できる量を超えてしまうのです。そして忘れることとコンテキストの劣化は、最も多い不満のひとつです(404 Media)。履歴自体はアカウントに保存されたまま。ただ、モデルがその全部を一度に見られないだけなのです。
AIロールプレイで記憶がいちばん優れているのはどれですか? 何をしたいか次第です。毎日戻ってくる一人のコンパニオンが欲しいなら、Kindroidの多層システムは強力です。もっとも、そのドキュメント自身が長期想起は「信頼できない可能性がある」と認めていますが(Kindroid)。物語全体のアークを通して筋が保たれなければならない長い物語なら、それこそSagaが作られているケースです。「何でも覚えている」という主張はどれも疑ってかかり、自分で試してみてください。
AIチャットボットは何もかも覚えていられますか? 文字どおりには無理ですし、できると言う相手は信用しないほうがいいです。コンテキストウィンドウの問題に加えて、メモリシステムそのものが抽出・更新・検索の各段階で情報をでっち上げたり失ったりします(HaluMem)。良いシステムは大事なことを確実に想起します。が、モデルがいつでも読み返せる、無限で完璧なログを保存しているわけではありません。
ロアブックとは何ですか? ロアブック(World Infoとも呼ばれます)は、自分の世界について書くエントリの集まりで、各エントリにはトリガーキーワードが紐づいていて、その語がチャットに現れたときだけエントリが注入されます(SillyTavern)。発火すれば正確で、しなければ沈黙します。トリガーを言い換えたりタイプミスしたりすると、エントリは読み込まれません。Sagaでは世界を支えるロアを自分で設定するので、正史(カノン)はモデルの推測に期待するものではなく、あなたが定義するものになります。
コンテキストウィンドウが大きいほど記憶も良くなりますか? いいえ。ウィンドウを大きくするのはある点までは助けになりますが、そこから先は「lost in the middle」――長いプロンプトの本体に埋もれた情報をモデルが落とす現象――にぶつかり、さらに順向干渉――検索が捏造へと崩れ落ちるまで、古いテキストが新しいテキストの想起を妨げる現象――にぶつかります(Atlan、arXiv)。トークンを増やすのは干し草の山を大きくすること。記憶とは、正しい針を見つけることなのです。
Sagaは今まさにプレビュー中なので、早めに参加して、実際に記憶がどう感じられるかを一緒に形づくっていけます。
質問があったり、ロールプレイのアイデアを語り合いたかったら、Discordに遊びに来てください。上記のプラットフォーム情報は、2026年半ば時点で公表されている情報を反映しています。システムは変化が速いので、最新の情報は出典リンクを確認してください。























