Pusat bantuan Replika bilang ia "menyimpan segalanya sejak awal." Hasil pembongkarannya menunjukkan fakta yang berbeda: modelnya hanya melihat kira-kira 25 pesan terakhir, jadi semua yang lebih lama tersimpan di akun kamu di tempat yang tidak bisa dibaca AI saat inference (thredly.io). Riwayatnya tersimpan. Tapi tidak diingat. Selisih itulah masalah utamanya.
Kalau kamu pernah memberi tahu sebuah karakter namamu, latar belakangmu, hal yang kalian putuskan bersama di hari pertama, lalu melihatnya bengong lima puluh pesan setelahnya, kamu sudah merasakannya. Log obrolannya jelas-jelas ada di layarmu. Modelnya saja yang tidak membacanya.
Kenapa karakter AI lupa
Sebuah language model tidak menyimpan ingatan yang terus berjalan tentang percakapanmu seperti yang kamu punya. Setiap giliran, ia membaca satu blok teks berukuran tetap yang disebut context window, menghasilkan balasan, lalu melupakan bahwa ia pernah membacanya. Apa pun yang tidak muat di jendela itu pada giliran ini bisa dibilang seakan tidak pernah ada.
Ketika obrolan tumbuh melampaui kapasitas jendela, teks paling lama terdorong keluar untuk memberi ruang bagi yang paling baru. Jendela yang lebih besar memberi kamu lebih banyak ruang, tapi biayanya lebih mahal, menambah latensi, dan menurun mutunya di bagian tengah: model secara konsisten kehilangan jejak informasi yang terkubur di antara awal dan akhir prompt yang panjang, yaitu efek "lost in the middle" (Atlan, bitfern). Jadi lupa bukanlah bug yang bisa diperbaiki sebuah patch. Itu perilaku bawaan dari arsitekturnya. Semua yang ada di bawah ini adalah upaya untuk menyiasatinya.
Cara-cara AI bisa "mengingat" (dan bagaimana masing-masing gagal)
Setiap sistem memori adalah strategi untuk mengembalikan teks lama yang tepat ke dalam jendela berukuran tetap itu pada momen yang tepat. Masing-masing menukar daya ingat dengan biaya, latensi, dan mode kegagalannya sendiri.
Rolling summarization. Sebuah LLM memampatkan giliran-giliran lama menjadi ringkasan berjalan yang ikut dibawa dalam prompt. Cara ini murah dan ringkas, dan memang dirancang untuk kehilangan detail: setiap putaran membuang detail demi tetap pendek. Detail kecil dari hari pertama selamat dari pemampatan pertama, menipis pada pemampatan kedua, dan lenyap pada pemampatan ketiga. Kamu baru sadar ketika si karakter membantah sesuatu yang kalian berdua sepakati seminggu lalu (mem0, Recursively Summarizing, arXiv).
Lorebook / World Info. Kamu menulis entri sendiri, dan masing-masing hanya disisipkan ketika kata kunci pemicunya muncul di teks (dokumentasi SillyTavern). Saat aktif, ia presisi. Masalahnya, AI sengaja dibuat buta terhadap lorebook-nya sendiri sampai sebuah kata kunci membangunkannya: parafrasakan pemicunya, salah ketik, atau sebut hal itu secara tidak langsung, dan entrinya diam-diam tidak akan pernah termuat. Pengetahuannya ada dan tetap tak terlihat.
Vector / RAG retrieval. Setiap pesan di-embed sebagai vektor lalu disimpan. Setiap giliran, sistem mengambil potongan yang paling mirip dengan apa yang baru saja kamu katakan dan menempelkannya (freeCodeCamp). Cara ini menskala ke riwayat yang sangat besar, dan itulah kekuatan sejatinya. Tapi ia juga memunculkan potongan yang salah ketika "paling mirip" ternyata bukan "paling relevan," dan memori salah yang diambil dengan penuh percaya diri lebih buruk daripada tidak ada sama sekali: ia menyodorkan premis palsu kepada model untuk dijadikan dasar.
Memori berlapis / terstruktur. Alih-alih membuang teks mentah, sebuah LLM mengekstraksi fakta-fakta penting lalu mengeluarkan operasi add, update, dan delete, atau menilai memori berdasarkan recency, importance, dan relevance seperti yang dilakukan karya Generative Agents (survei arXiv, Generative Agents). Ini lebih mendekati bagaimana seharusnya rasanya mengingat sesuatu. Tapi ia juga menambah satu langkah yang bisa gagal: benchmark HaluMem menunjukkan bahwa sistem memori mengarang dan kehilangan informasi pada tahap ekstraksi, pembaruan, dan pengambilan (HaluMem, arXiv). Memori berhalusinasi. Bukan cuma lupa.
Knowledge graph. Entitas menjadi node dan hubungan menjadi edge, dengan edge temporal yang melacak kapan sesuatu terjadi versus kapan ia dipelajari (makalah Zep / Graphiti). Inilah opsi paling terstruktur sekaligus paling banyak kerjanya untuk dibangun dan dijaga tetap bersih saat sebuah cerita bercabang.
Ada dua hal yang muncul dari sini. Pertama, trade-off-nya nyata dan tak terhindarkan: daya ingat versus biaya versus latensi versus risiko memori yang dikarang. Kedua, context window yang lebih besar bukanlah sebuah sistem memori. Lewat satu titik, informasi lama justru aktif menghalangi pengambilan informasi yang lebih baru ("proactive interference"), dan pada interferensi tinggi, pengambilan langsung ambruk menjadi pengarangan alih-alih menurun mutunya secara perlahan (studi proactive interference, arXiv). Lebih banyak token berarti tumpukan jerami yang lebih besar, bukan jarum yang lebih bagus.
Bagaimana tiap platform menanganinya
Versi singkat soal siapa melakukan apa, dan di mana masing-masing retak. Isi sel sengaja dibuat ringkas.
| Platform | Cara mengingatnya | Di mana ia jebol |
|---|---|---|
| Character.AI | Pesan yang disematkan plus jendela melupakan antar sesi | Lupa dan context rot jadi keluhan pengguna nomor satu (404 Media) |
| AI Dungeon | Story Summary yang bisa diedit plus lapisan RAG Memory Bank dan Story Cards berbasis kata kunci (Latitude, bantuan) | Slot memori dibatasi per tier dengan penghapusan yang paling jarang dipakai; AI buta terhadap Story Card sampai kata kunci persis termuat (bantuan) |
| SillyTavern | Kamu menumpuk World Info, Author's Note, Summarize, dan Vector Storage sendiri (World Info, Summarize) | Sepenuhnya manual; entri berbasis kata kunci meleset pada frasa di luar kata kunci; dokumentasi Summarize memperingatkan output bisa "melenceng dan berhalusinasi" |
| Kindroid | Latar belakang yang selalu ada di konteks plus memori jangka panjang yang bisa diambil dan jurnal frasa kunci (dokumentasi) | Dokumentasinya mengakui memori jangka panjang "berpotensi tidak andal"; tier terdalamnya berbayar; frasa kunci jurnal harus cocok persis |
| Nomi | Mind Map yang terbangun selama riwayat yang panjang (Nomi) | Peta baru terwujud setelah ~500 pesan, daya ingat andal dipatok pada 1.000+; Identity Core tidak bisa dilihat atau diedit |
| Replika | Akun mengklaim menyimpan segalanya sejak awal (thredly) | Model hanya melihat ~25 pesan terbaru; sisanya tersimpan tapi tak terlihat saat inference |
| Saga | Bertahan di sepanjang cerita panjang; kamu yang menetapkan lore-nya | Masih preview, pustakanya masih kecil |
Beberapa di antaranya pantas dapat satu kalimat. SpicyChat mengunci lorebook di balik tier berbayar dan membatasi konteks tier gratis di 4.096 token, jadi memori di sana sudah pendek sebelum teknik apa pun diterapkan (dokumentasi SpicyChat). Lorebook NovelAI mengaktifkan entri lewat pemicu kata kunci (dokumentasi NovelAI), pola presisi tapi rapuh yang sama dengan milik semua orang.
Jadi apa sebenarnya arti "memori yang bekerja"?
Perhatikan apa yang tidak ada di tabel itu: sebuah platform yang "tidak pernah lupa." Siapa pun yang menjanjikan itu sedang menjual versi marketing dari klaim Replika "menyimpan segalanya." Pertanyaan yang berguna lebih sempit. Apakah si karakter masih ingat hal yang penting ketika cerita memanjang, tepat di titik di mana memori sematan dan persisten di tempat lain jelas-jelas jebol?
Itulah standar yang Saga dibangun untuk melampauinya. Yang penting adalah pengalamannya: karakter mengingat apa yang terjadi di sepanjang cerita panjang, merujuk kembali padanya, dan berubah karenanya, dan kamu yang menetapkan lore yang menjangkar sebuah dunia sehingga AI bekerja dari kanon-mu alih-alih menebak-nebak. Adegan yang lebih pendek dan santai pun sama cocoknya.
Ada sebuah tes yang bisa kamu jalankan sendiri. Tetapkan sebuah fakta, mainkan 200 pesan melewatinya, lalu rujuk fakta itu secara tidak langsung dan lihat apakah si karakter masih memilikinya. Itulah momen ketika summarization menjatuhkan detail dan lorebook berbasis kata kunci tetap bungkam, dan itulah kasus yang Saga dibangun untuknya. Di luar soal memorinya, bagian lain pun tetap pada tempatnya: Saga mengarahkan rute lintas model lewat OpenRouter, jadi kamu tidak terkunci pada satu penyedia kalau kualitasnya merosot. Para kreator menetapkan batas kontennya, dengan satu garis tegas yang tidak bergeser: tidak ada yang melibatkan anak di bawah umur. Percakapan dienkripsi saat transit dan disimpan dengan aman, tidak pernah dijual dan tidak pernah dipakai untuk melatih model. Saga berjalan dengan kredit, dengan kredit gratis untuk memulai dan opsi bring-your-own-key yang direncanakan, dan saat ini berada dalam preview dengan waitlist.
Kalau kamu sedang memetakan lapangan yang lebih luas, panduan kami soal alternatif Character.AI membahas platform-platform di atas dari sisi harga, kebijakan konten, dan cocok buat siapa masing-masingnya.
Pertanyaan yang sering diajukan
Kenapa Character.AI melupakan segalanya? Modelnya membaca context window berukuran tetap setiap giliran, dan begitu obrolan tumbuh melampaui jendela itu, teks paling lama dipangkas. Obrolan panjang memang melebihi apa yang bisa dipegang model sekaligus, dan lupa serta context rot termasuk keluhan paling umum (404 Media). Riwayatnya tetap tersimpan di akunmu; modelnya saja yang tidak bisa melihat semuanya sekaligus.
Roleplay AI mana yang memorinya paling bagus? Tergantung apa yang kamu lakukan. Untuk satu pendamping yang kamu temui tiap hari, sistem berlapis Kindroid tergolong kuat, meski dokumentasinya mengakui daya ingat jangka panjangnya "berpotensi tidak andal" (Kindroid). Untuk cerita panjang yang benangnya harus bertahan di sepanjang satu arc utuh, itulah kasus yang Saga dibangun untuknya. Sikapi setiap klaim "mengingat segalanya" dengan curiga dan ujilah sendiri.
Bisakah chatbot AI mengingat segalanya? Tidak secara harfiah, dan kamu sebaiknya curiga pada siapa pun yang bilang bisa. Di luar context window, sistem memori itu sendiri mengarang dan kehilangan informasi pada tahap ekstraksi, pembaruan, dan pengambilan (HaluMem). Sistem yang baik mengingat hal yang penting secara andal; ia tidak menyimpan transkrip tak terbatas dan sempurna yang bisa dibaca model sesuka hati.
Apa itu lorebook? Lorebook (disebut juga World Info) adalah kumpulan entri yang kamu tulis tentang duniamu, masing-masing terikat pada kata kunci pemicu yang menyisipkan entri itu hanya ketika kata tersebut muncul di obrolan (SillyTavern). Ia presisi saat aktif dan bungkam saat tidak: parafrasakan atau salah ketik pemicunya dan entrinya tidak akan termuat. Di Saga kamu yang menetapkan lore yang menjangkar sebuah dunia, jadi kanon adalah sesuatu yang kamu definisikan alih-alih berharap modelnya menyimpulkan sendiri.
Apakah context window yang lebih besar berarti memori yang lebih baik? Tidak. Jendela yang lebih besar membantu sampai satu titik, lalu menabrak "lost in the middle," di mana model menjatuhkan informasi yang terkubur di badan prompt yang panjang, dan menabrak proactive interference, di mana teks lama menghalangi pengambilan teks yang lebih baru sampai pengambilannya ambruk menjadi pengarangan (Atlan, arXiv). Lebih banyak token berarti tumpukan jerami yang lebih besar. Memori itu soal menemukan jarum yang tepat.
Saga sedang dalam preview saat ini, jadi kamu bisa ikut lebih awal dan membantu membentuk bagaimana memorinya terasa dalam praktik.
Ada pertanyaan, atau ingin bertukar ide roleplay? Mampir dan nongkrong di Discord. Detail platform di atas mencerminkan informasi yang dilaporkan publik per pertengahan 2026; sistem berubah cepat, jadi cek tautan sumber untuk yang terbaru.























