Replika는 "처음부터 나눈 모든 걸 기억한다"고 말해요. 하지만 뜯어보면 얘기가 달라요. 모델이 실제로 보는 건 최근 25개 안팎의 메시지뿐이고, 그보다 오래된 건 계정 어딘가에 남아 있긴 해도 AI가 답을 만드는 순간엔 읽지 못하는 곳에 있어요 (thredly.io). 기록은 저장돼 있어요. 다만 기억되고 있진 않은 거죠. 문제는 바로 그 간극이에요.
캐릭터에게 내 이름이랑 배경 설정, 첫날 둘이 같이 정한 약속까지 다 알려줬는데, 쉰 메시지쯤 지나니 그게 싹 백지가 되는 걸 본 적 있다면, 이미 그 느낌을 알고 있는 거예요. 채팅 로그는 화면에 멀쩡히 떠 있어요. 모델이 그냥 그걸 안 보고 있을 뿐이죠.
AI 캐릭터는 왜 잊어버릴까
언어 모델에는 우리가 대화를 기억하듯 내용을 계속 붙잡아 두는 기억이 없어요. 매 턴마다 컨텍스트 윈도우라고 부르는 고정된 크기의 텍스트 덩어리를 읽고, 답을 만들어 내고, 읽었다는 사실 자체를 잊어버리거든요. 이번 턴에 그 윈도우에 들어가지 못한 건 사실상 없는 거나 마찬가지예요.
채팅이 윈도우에 담기는 양을 넘어 길어지면, 가장 오래된 텍스트가 새 내용 들어갈 자리를 내주려고 바깥으로 밀려나요. 윈도우를 키우면 공간이야 더 생기지만, 그만큼 비용이 늘고 응답이 느려지고 가운데가 부실해져요. 모델은 긴 프롬프트의 처음과 끝 사이에 파묻힌 정보를 어김없이 놓치는데, 이게 바로 "lost in the middle"(가운데에서 길을 잃는) 현상이에요 (Atlan, bitfern). 그러니까 잊어버리는 건 패치 한 번으로 고쳐질 버그가 아니에요. 이 구조 자체의 기본 동작이죠. 아래에 나오는 건 전부 그걸 어떻게든 우회해 보려는 시도예요.
AI가 "기억"하는 방법들 (그리고 각각이 무너지는 지점)
모든 기억 시스템은 결국 알맞은 과거 텍스트를 알맞은 순간에 그 고정된 윈도우 안으로 다시 끌어오기 위한 전략이에요. 그리고 저마다 회상 능력을 비용, 지연, 그리고 각자 나름의 실패 방식과 맞바꾸죠.
롤링 요약(Rolling summarization). LLM이 오래된 턴들을 프롬프트에 늘 따라붙는 누적 요약으로 압축해요. 싸고 간결하지만, 설계상 정보가 새어 나가요. 압축할 때마다 길이를 줄이려고 디테일을 버리거든요. 가까스로 살아남은 첫날의 사실 하나가 첫 압축은 버티고, 두 번째엔 흐릿해지고, 세 번째엔 사라져요. 일주일 전에 둘이 함께 정해둔 걸 캐릭터가 뒤집기 전까진 눈치도 못 채죠 (mem0, Recursively Summarizing, arXiv).
로어북(Lorebook) / World Info. 항목을 일일이 손으로 작성하고, 각 항목은 자기 트리거 키워드가 텍스트에 등장할 때만 주입돼요 (SillyTavern 문서). 발동되면 정확해요. 함정은 키워드가 항목을 깨우기 전까진 AI가 구조상 자기 로어북을 아예 못 본다는 점이에요. 트리거를 다른 말로 바꿔 쓰거나, 철자를 틀리거나, 그 대상을 에둘러 가리키면, 항목은 끝내 조용히 로드되지 않아요. 지식은 있는데 보이지 않는 채로 남는 거죠.
벡터(Vector) / RAG 검색. 모든 메시지가 벡터로 임베딩되어 저장돼요. 매 턴마다 시스템이 방금 한 말과 가장 비슷한 조각들을 끌어와 붙여 넣어요 (freeCodeCamp). 이건 엄청난 분량의 기록까지 감당할 수 있고, 그게 진짜 강점이에요. 하지만 "가장 비슷한" 게 "가장 관련 있는" 건 아닐 때 엉뚱한 조각을 끌어오기도 하는데, 멀쩡한 양 잘못 불려 온 기억은 차라리 없느니만 못해요. 모델한테 그 위에 쌓아 올릴 거짓 전제를 쥐여주는 셈이니까요.
다층(Multi-layer) / 구조화된 기억. 원본 텍스트를 통째로 쏟아붓는 대신, LLM이 핵심 사실만 뽑아내서 추가·갱신·삭제를 하거나, Generative Agents 연구처럼 기억마다 최신성·중요도·관련성으로 점수를 매겨요 (arXiv 서베이, Generative Agents). 이건 우리가 생각하는 '기억다운 기억'에 한결 가까워요. 다만 실패할 수 있는 단계가 하나 더 늘어나는데, HaluMem 벤치마크를 보면 기억 시스템이 추출·갱신·검색 단계에서 정보를 지어내기도 하고 잃어버리기도 해요 (HaluMem, arXiv). 기억이 그냥 사라지기만 하는 게 아니라, 아예 없는 걸 지어내기도 한다는 거죠.
지식 그래프(Knowledge graph). 개체는 노드가 되고 관계는 엣지가 되며, 어떤 일이 언제 일어났고 언제 알게 됐는지까지 추적하는 시간 엣지가 함께 따라붙어요 (Zep / Graphiti 논문). 가장 짜임새 있는 방식이지만, 이야기가 여러 갈래로 뻗어 나갈 때 그걸 구축하고 깔끔하게 유지하는 데 손이 제일 많이 가요.
여기서 두 가지가 드러나요. 첫째, 트레이드오프는 진짜이고 피할 수 없어요. 회상 능력, 비용, 지연, 기억을 지어낼 위험 사이에서 어디 하나는 양보해야 하죠. 둘째, 컨텍스트 윈도우가 크다고 그게 곧 기억 시스템인 건 아니에요. 어느 선을 넘어가면, 오래된 정보가 더 새로운 정보를 떠올리는 걸 적극적으로 방해하고("선행 간섭", proactive interference), 간섭이 심해지면 검색이 서서히 나빠지는 정도가 아니라 아예 날조로 무너져 내려요 (선행 간섭 연구, arXiv). 토큰이 많아진다는 건 건초더미가 더 커진다는 거지, 바늘이 더 잘 찾아진다는 뜻이 아니에요.
플랫폼들은 이걸 어떻게 다룰까
누가 무엇을 하고 각각 어디서 금이 가는지 짧게 정리했어요. 칸은 일부러 빡빡하게 유지했어요.
| 플랫폼 | 어떻게 기억하나 | 어디서 무너지나 |
|---|---|---|
| Character.AI | 고정 메시지(핀) + 일정 분량이 지나면 잊는 윈도우 | 망각과 컨텍스트 손실이 유저 불만 1순위로 꼽혀요 (404 Media) |
| AI Dungeon | 편집 가능한 Story Summary + Memory Bank RAG 계층 + 키워드 Story Cards (Latitude, 도움말) | 기억 슬롯은 등급별로 제한되고 가장 안 쓴 것부터 밀려나요. AI는 정확한 키워드가 로드되기 전까진 Story Card를 못 봐요 (도움말) |
| SillyTavern | World Info, Author's Note, Summarize, Vector Storage를 직접 조합해 쌓아요 (World Info, Summarize) | 전부 수동. 키워드 항목은 키워드를 벗어난 표현을 놓치고, Summarize 문서도 출력이 "엇나가고 환각을 일으킨다"고 경고해요 |
| Kindroid | 항상 컨텍스트에 있는 배경 + 검색 가능한 장기 기억 + 키프레이즈 저널 (문서) | 문서가 장기 기억이 "신뢰하기 어려울 수 있다"고 인정해요. 가장 깊은 계층은 유료고, 저널 키프레이즈는 글자 그대로 맞아야 해요 |
| Nomi | 긴 대화 이력에 걸쳐 쌓이는 Mind Map (Nomi) | 맵은 메시지 500개쯤 지나야 형태를 갖추고, 안정적으로 떠올리려면 1,000개는 넘어야 해요. Identity Core는 보지도 편집하지도 못해요 |
| Replika | 계정 차원에서 처음부터 나눈 모든 걸 기억한다고 주장해요 (thredly) | 모델이 보는 건 최근 25개 안팎의 메시지뿐. 나머지는 저장은 돼 있어도 답을 만드는 순간엔 안 보여요 |
| Saga | 긴 이야기 내내 유지돼요. 로어는 당신이 정해요 | 프리뷰 단계라 라이브러리가 아직 작아요 |
이 중 몇 개는 한마디 더 보탤 만해요. SpicyChat은 로어북을 유료 등급에서만 풀어주고 무료 등급 컨텍스트를 4,096 토큰으로 묶어둬서, 무슨 기법을 써보기도 전에 기억이 그 선에서 뚝 끊겨요 (SpicyChat 문서). NovelAI의 로어북은 키워드 트리거로 항목을 켜는데 (NovelAI 문서), 다른 데와 똑같이 정확하지만 깨지기 쉬운 바로 그 방식이에요.
그래서 "제대로 작동하는 기억"이란 게 뭘까
표에 없는 항목을 눈여겨보세요. "절대 안 잊는" 플랫폼이요. 그렇게 약속하는 곳은 결국 Replika의 "모든 걸 기억한다"를 말만 바꿔서 똑같이 파는 거예요. 정작 쓸모 있는 질문은 더 좁아요. 이야기가 길어져서 다른 데라면 고정 메모리든 영구 메모리든 눈에 띄게 무너질 그 지점에서, 우리 캐릭터는 중요한 걸 여전히 떠올릴 수 있느냐는 거죠.
Saga는 바로 그 기준을 넘기려고 만든 거예요. 중요한 건 결국 경험이죠. 캐릭터가 긴 이야기 내내 무슨 일이 있었는지 기억하고, 그걸 다시 끄집어내고, 그 일을 겪은 만큼 달라져요. 게다가 세계의 바탕이 되는 로어를 당신이 직접 정해두면, AI가 어림짐작하는 대신 당신의 캐넌(canon)에서 출발해요. 더 짧고 가벼운 장면에도 똑같이 잘 맞고요.
직접 해볼 수 있는 테스트가 하나 있어요. 어떤 사실을 정해두고, 그 뒤로 메시지를 200개쯤 주고받은 다음, 그걸 에둘러 슬쩍 언급해서 캐릭터가 아직 기억하고 있는지 보세요. 요약이 디테일을 떨구고 키워드 로어북이 입을 다무는 게 바로 이 순간인데, Saga는 정확히 이런 상황을 노리고 만든 거예요. 기억이 버텨주니 그 위의 나머지도 같이 형태를 지키고요. Saga는 OpenRouter를 통해 여러 모델로 라우팅하기 때문에, 어느 한 제공사의 품질이 떨어진다고 거기에 발이 묶이지 않아요. 콘텐츠 경계는 제작자가 정하되, 절대 움직이지 않는 선이 딱 하나 있어요. 미성년자가 얽힌 건 무조건 안 돼요. 대화는 전송 구간에서 암호화되고 안전하게 저장되며, 절대 판매되지 않고 모델 학습에도 절대 쓰이지 않아요. 크레딧 기반으로 돌아가고, 시작용 무료 크레딧이 주어지며, 자기 키를 가져오는(BYOK) 옵션도 계획돼 있어요. 그리고 지금은 대기자 명단을 받는 프리뷰 단계예요.
전체 그림이 궁금하다면, 저희 Character.AI 대안 가이드에서 위 플랫폼들을 가격과 콘텐츠 정책, 그리고 어떤 사람한테 맞는지까지 짚어뒀어요.
자주 묻는 질문
Character.AI는 왜 다 잊어버리나요? 모델이 매 턴마다 고정된 컨텍스트 윈도우를 읽는데, 채팅이 그 윈도우보다 길어지면 가장 오래된 텍스트가 잘려 나가요. 긴 채팅은 모델이 한 번에 담아둘 수 있는 양을 그냥 넘어버리고, 망각과 컨텍스트 손실은 가장 흔한 불만 중 하나예요 (404 Media). 기록은 여전히 계정에 저장돼 있어요. 모델이 그걸 한 번에 다 보지 못할 뿐이죠.
어떤 AI 롤플레이가 기억력이 가장 좋나요? 뭘 하려느냐에 따라 달라요. 매일 찾는 동반자가 목적이라면 Kindroid의 다층 시스템이 강하지만, 그 문서조차 장기 회상이 "신뢰하기 어려울 수 있다"고 인정해요 (Kindroid). 줄거리가 아크 하나를 통째로 가로질러 이어져야 하는 긴 이야기라면, Saga가 바로 그런 경우를 노리고 만든 거예요. "모든 걸 기억한다"는 주장은 뭐가 됐든 일단 의심하고 직접 테스트해 보세요.
AI 챗봇이 모든 걸 기억할 수 있나요? 말 그대로는 아니에요. 그렇다고 하는 곳이 있으면 믿지 마세요. 컨텍스트 윈도우 바깥에선 기억 시스템 자체가 추출·갱신·검색 단계에서 정보를 지어내기도 하고 잃어버리기도 해요 (HaluMem). 좋은 시스템은 중요한 걸 안정적으로 떠올려요. 모델이 언제든 들춰볼 수 있는 무한하고 완벽한 기록을 통째로 저장해 두는 게 아니라요.
로어북이 뭔가요? 로어북(World Info라고도 해요)은 당신이 세계관에 대해 적어두는 항목 모음인데, 각 항목이 트리거 키워드에 묶여서 그 단어가 채팅에 나올 때만 주입돼요 (SillyTavern). 발동되면 정확하고, 안 되면 입을 다물어요. 트리거를 다른 말로 바꾸거나 철자를 틀리면 항목은 끝내 로드되지 않아요. Saga에서는 세계의 바탕이 되는 로어를 당신이 직접 정하니까, 캐넌(canon)은 모델이 알아서 추론해 주길 바라는 게 아니라 당신이 정하는 거예요.
컨텍스트 윈도우가 크면 기억력이 더 좋은 건가요? 아니에요. 윈도우를 키우면 어느 선까지는 도움이 되지만, 그 뒤로는 "lost in the middle"에 부딪혀요. 모델이 긴 프롬프트 한가운데 파묻힌 정보를 흘려버리는 현상이죠. 거기에 선행 간섭까지 겹쳐요. 오래된 텍스트가 더 새로운 텍스트를 떠올리는 걸 가로막다가 검색이 아예 날조로 무너지는 현상이에요 (Atlan, arXiv). 토큰이 많아진다는 건 건초더미가 더 커진다는 뜻이에요. 정작 기억은 알맞은 바늘을 찾아내는 일이고요.
Saga는 지금 프리뷰 단계라, 일찍 합류하면 기억이 실제로 어떤 느낌이어야 하는지 함께 만들어갈 수 있어요.
궁금한 게 있거나 롤플레이 아이디어를 나누고 싶다면, Discord로 놀러 오세요. 위 플랫폼 정보는 2026년 중반 기준으로 공개된 내용을 반영했어요. 시스템은 빠르게 바뀌니, 최신 정보는 출처 링크를 확인하세요.























