Replika'nın yardım merkezi "en baştan beri her şeyi koruduğunu" söylüyor. Teknik incelemeler ise başka bir hikâye anlatıyor: model yalnızca aşağı yukarı son 25 mesajı görüyor, yani daha eski olan her şey hesabında, yapay zekânın çıkarım anında okuyamadığı bir yerde duruyor (thredly.io). Geçmiş saklanıyor. Ama hatırlanmıyor. Bütün sorun da işte bu boşlukta.
Bir karaktere adını, geçmişini, ilk gün birlikte karar verdiğiniz şeyi anlattıysan ve elli mesaj sonra onun boş boş baktığını gördüysen, bunu zaten hissetmişsindir. Sohbet kaydı tam orada, ekranında duruyor. Model sadece ona bakmıyor.
Yapay zekâ karakterleri neden unutur
Bir dil modelinin, senin sahip olduğun gibi konuşmayı baştan sona akılda tutan bir hafızası yoktur. Her turda, bağlam penceresi denen sabit boyutlu bir metin bloğunu okur, bir yanıt üretir ve okuduğunu unutur. O turda bu pencereye sığmayan her şey, sanki hiç yokmuş gibidir.
Bir sohbet, pencerenin alabileceğinin ötesine büyüdükçe, en yeni metne yer açmak için en eski metin dışarı itilir. Daha büyük pencereler sana daha çok yer kazandırır ama daha pahalıdır, gecikmeyi artırır ve ortada bozulur: modeller, uzun bir prompt'un başı ile sonu arasına gömülü bilgiyi güvenilir biçimde kaybeder, yani "ortada kaybolma" (lost in the middle) etkisi (Atlan, bitfern). Yani unutmak, bir yamayla düzeltilecek bir hata değil. Mimarinin varsayılan davranışı. Aşağıdaki her şey, bunun etrafından dolanma çabası.
Bir yapay zekânın "hatırlamasının" yolları (ve her birinin nasıl çuvalladığı)
Her hafıza sistemi, doğru eski metni doğru anda o sabit pencereye geri sokmanın bir stratejisidir. Her biri, hatırlamayı maliyet, gecikme ve kendine özgü bir çuvallama biçimiyle takas eder.
Kayan özetleme. Bir dil modeli, eski turları prompt'la birlikte taşınan, sürekli güncellenen bir özete sıkıştırır. Ucuz ve derli toplu, ama tasarımı gereği kayıplı: her geçişte kısa kalmak için ayrıntı atılır. Nadir bir ilk gün ayrıntısı ilk sıkıştırmadan sağ çıkar, ikincide incelir ve üçüncüde yok olur. İkinizin bir hafta önce birlikte kurduğunuz bir şeyle karakter çelişene kadar fark etmezsin (mem0, Recursively Summarizing, arXiv).
Lorebook'lar / World Info. Girdileri elle sen yazarsın ve her biri yalnızca tetikleyici anahtar sözcüğü metinde belirdiğinde enjekte edilir (SillyTavern docs). Ateşlendiğinde tam isabet. İşin püf noktası şu: yapay zekâ, bir anahtar sözcük onu uyandırana kadar kendi lorebook'una tasarımı gereği kördür: tetikleyiciyi başka sözcüklerle ifade et, yanlış yaz ya da o şeye dolaylı yoldan değin, girdi sessizce hiç yüklenmez. Bilgi var ve görünmez kalıyor.
Vektör / RAG erişimi. Her mesaj bir vektör olarak gömülür ve saklanır. Sistem her turda, az önce söylediğine en benzer parçaları getirir ve yapıştırır (freeCodeCamp). Bu, devasa geçmişlere ölçeklenir ki asıl gücü de budur. Ama "en benzer" ile "en alakalı" aynı olmadığında yanlış parçayı öne çıkarır ve kendinden emin biçimde getirilen yanlış bir hafıza, hiç hafıza olmamasından beterdir: modele üzerine inşa edeceği yanlış bir öncül sunar.
Çok katmanlı / yapılandırılmış hafıza. Ham metni öylece boca etmek yerine bir dil modeli önemli olguları çıkarır ve ekleme, güncelleme, silme işlemleri yürütür ya da Generative Agents çalışmasının yaptığı gibi hafızaları yenilik, önem ve alaka düzeyine göre puanlar (arXiv survey, Generative Agents). Bu, hatırlamanın hissettirmesi gerektiği şeye daha yakın. Ama çuvallayabilecek bir adım daha ekliyor: HaluMem kıyaslaması, hafıza sistemlerinin çıkarma, güncelleme ve erişim aşamalarında bilgi uydurduğunu ve kaybettiğini gösteriyor (HaluMem, arXiv). Hafıza halüsinasyon görür. Yalnızca unutmaz.
Bilgi grafikleri. Varlıklar düğüm, ilişkiler kenar olur; bir şeyin ne zaman olduğu ile ne zaman öğrenildiğini izleyen zamansal kenarlarla birlikte (Zep / Graphiti paper). En yapılandırılmış seçenek; bir hikâye dallandıkça kurması ve temiz tutması da en çok emek isteyeni.
Bundan iki şey çıkıyor. Birincisi, ödünleşim gerçek ve kaçınılmaz: hatırlama mı, maliyet mi, gecikme mi, yoksa uydurulmuş hafıza riski mi. İkincisi, daha büyük bir bağlam penceresi bir hafıza sistemi değil. Bir noktadan sonra eski bilgi, daha yeni bilginin hatırlanmasını aktif olarak engeller ("ileriye dönük girişim") ve yüksek girişimde erişim, zarifçe bozulmak yerine doğrudan uydurmaya çöker (proactive interference study, arXiv). Daha çok token, daha çok samanlık demek; daha iyi bir iğne değil.
Platformlar bunu nasıl ele alıyor
Kimin ne yaptığının ve her birinin nerede çatladığının kısa hâli. Hücreler bilinçli olarak kısa tutuldu.
| Platform | Nasıl hatırlıyor | Nerede çuvallıyor |
|---|---|---|
| Character.AI | Sabitlenmiş mesajlar artı oturumlar arası bir unutma penceresi | Unutma ve bağlamın çürümesi, en üst sıradaki kullanıcı şikâyetleri (404 Media) |
| AI Dungeon | Düzenlenebilir Story Summary artı bir Memory Bank RAG katmanı ve anahtar sözcüklü Story Cards (Latitude, help) | Hafıza yuvaları katmana göre sınırlı, en az kullanılan tahliye ediliyor; yapay zekâ tam anahtar sözcük yüklenene dek bir Story Card'a kör (help) |
| SillyTavern | World Info, Author's Note, Summarize ve Vector Storage'ı elle sen üst üste dizersin (World Info, Summarize) | Tamamen elle; anahtarlı girdiler anahtar dışı ifadeyi kaçırır; Summarize belgeleri çıktının "kayar ve halüsinasyon görür" diye uyarıyor |
| Kindroid | Her zaman bağlamda olan geçmiş artı getirilebilir uzun vadeli hafıza ve bir anahtar ifade günlüğü (docs) | Belgeler uzun vadeli hafızanın "potansiyel olarak güvenilmez" olduğunu kabul ediyor; en derin katman ücretli; günlük anahtar ifadeleri birebir eşleşmek zorunda |
| Nomi | Uzun bir geçmiş boyunca birikip oluşan bir Mind Map (Nomi) | Harita ancak ~500 mesajdan sonra somutlaşıyor, güvenilir hatırlama 1.000+ mesaja bağlı; Identity Core görüntülenemez ya da düzenlenemez |
| Replika | Hesap, en baştan beri her şeyi koruduğunu iddia ediyor (thredly) | Model yalnızca ~25 yeni mesajı görüyor; gerisi saklanıyor ama çıkarımda görünmez |
| Saga | Uzun bir hikâye boyunca tutar; lore'u sen belirlersin | Önizlemede, kütüphane henüz küçük |
Bunların birkaçı bir cümleyi hak ediyor. SpicyChat, lorebook'ları ücretli katmanların arkasına kilitliyor ve ücretsiz katman bağlamını 4.096 token'la sınırlıyor, yani oradaki hafıza herhangi bir teknik devreye girmeden kısa kalıyor (SpicyChat docs). NovelAI'ın lorebook'u girdileri anahtar sözcük tetikleyicileriyle etkinleştiriyor (NovelAI docs) ki bu da herkesinkiyle aynı, tam isabetli ama kırılgan kalıp.
Peki "işe yarayan hafıza" gerçekte ne demek?
Tablonun içermediği şeye dikkat et: "asla unutmayan" bir platform yok. Bunu vaat eden herkes, sana Replika'nın "her şeyi korur" söyleminin pazarlama sürümünü satıyor. Asıl işe yarar soru daha dar. Hikâye uzadıkça, başka yerlerde sabitlenmiş ve kalıcı hafızanın gözle görülür biçimde çöktüğü tam o noktada, karakter önemli olanı hâlâ hatırlıyor mu?
Saga işte o çıtayı aşmak için kuruldu. Önemli olan deneyim: karakterler uzun bir hikâye boyunca olanları hatırlar, onlara geri döner ve bunlar yüzünden değişir; bir dünyayı sabitleyen lore'u da sen belirlersin, böylece yapay zekâ tahmin yürütmek yerine senin kanonunu temel alır. Daha kısa, gündelik sahneler de en az onun kadar oturur.
Kendi başına yapabileceğin bir test var. Bir olgu kur, üstünden 200 mesaj geçecek kadar oyna, sonra ona dolaylı yoldan değin ve karakterin onu hâlâ akılda tutup tutmadığına bak. Özetlemenin ayrıntıyı düşürdüğü ve anahtar sözcüklü bir lorebook'un sustuğu an tam da budur; Saga da işte bu durum için kuruldu. Hafızanın çevresinde geri kalan her şey de yerli yerinde duruyor: Saga, modeller arasında OpenRouter üzerinden yönlendirme yapıyor, yani bir sağlayıcının kalitesi düşerse ona kilitli kalmıyorsun. İçerik sınırlarını, asla esnemeyen tek bir kesin çizgi dışında, yaratıcılar belirliyor: reşit olmayanların yer aldığı hiçbir şey. Konuşmalar aktarımda şifreleniyor ve güvenli biçimde saklanıyor, asla satılmıyor ve modelleri eğitmek için asla kullanılmıyor. Kredilerle çalışıyor; başlangıç için biraz ücretsiz kredi veriyor ve kendi anahtarını getirme (BYOK) seçeneği de planlanıyor. Şu an bekleme listesiyle önizleme aşamasında.
Daha geniş bir tabloya bakmak istiyorsan, Character.AI alternatifleri rehberimiz yukarıdaki platformları fiyat, içerik politikası ve her birinin kime göre olduğu üzerinden ele alıyor.
Sık sorulan sorular
Character.AI neden her şeyi unutuyor? Modeli her turda sabit bir bağlam penceresi okuyor ve bir sohbet o pencerenin sınırını aştığında en eski metin kırpılıyor. Uzun sohbetler, modelin bir anda tutabileceğini fazlasıyla aşıyor; unutma ve bağlamın çürümesi de en sık dile getirilen şikâyetler arasında (404 Media). Geçmiş hâlâ hesabında saklı; model sadece hepsini aynı anda göremiyor.
Hangi yapay zekâ roleplay'inin hafızası en iyi? Ne yaptığına bağlı. Her gün geri döndüğün tek bir companion için Kindroid'in çok katmanlı sistemi güçlü, gerçi belgeleri uzun vadeli hatırlamanın "potansiyel olarak güvenilmez" olduğunu kabul ediyor (Kindroid). Koca bir hikâye yayı boyunca tutarlılığını koruması gereken uzun bir hikâye içinse, Saga işte o durum için kuruldu. Her "her şeyi hatırlıyor" iddiasına şüpheyle yaklaş ve onu kendin test et.
Bir yapay zekâ sohbet botu her şeyi hatırlayabilir mi? Tam anlamıyla değil ve bunu yapabileceğini söyleyen herkese güvenmemelisin. Bağlam penceresinin ötesinde, hafıza sistemlerinin kendisi çıkarma, güncelleme ve erişim aşamalarında bilgi uyduruyor ve kaybediyor (HaluMem). İyi bir sistem, önemli olanı güvenilir biçimde hatırlar; modelin canı istediğinde okuyabileceği sonsuz, kusursuz bir döküm saklamaz.
Lorebook nedir? Bir lorebook (World Info olarak da bilinir), dünyan hakkında yazdığın girdilerden oluşan bir settir; her biri bir tetikleyici anahtar sözcüğe bağlıdır ve girdiyi yalnızca o sözcük sohbette belirdiğinde enjekte eder (SillyTavern). Ateşlendiğinde tam isabet, ateşlenmediğinde sessizdir: tetikleyiciyi başka sözcüklerle ifade et ya da yanlış yaz, girdi hiç yüklenmesin. Saga'da bir dünyayı sabitleyen lore'u sen belirlersin, yani kanon, modelin doğru tahmin etmesini umduğun değil senin tanımladığın bir şey olur.
Daha büyük bir bağlam penceresi daha iyi hafıza demek mi? Hayır. Daha büyük bir pencere bir noktaya kadar yardımcı olur, sonra iki duvara birden toslar. Biri "ortada kaybolma": modeller uzun bir prompt'un gövdesine gömülü bilgiyi düşürür. Diğeri ileriye dönük girişim: eski metin, erişim uydurmaya çökene dek daha yeni metnin hatırlanmasını engeller (Atlan, arXiv). Daha çok token, daha büyük bir samanlık. Hafıza ise doğru iğneyi bulmakla ilgili.
Saga şu anda önizlemede, yani erkenden katılıp hafızanın pratikte nasıl çalışacağını şekillendirmeye yardım edebilirsin.
Saga bekleme listesine katıl →
Soruların mı var ya da roleplay üzerine fikir alışverişi mi yapmak istiyorsun? Gel Discord'da takılalım. Yukarıdaki platform ayrıntıları, 2026 ortası itibarıyla kamuya açık biçimde bildirilen bilgileri yansıtıyor; sistemler hızla değişiyor, o yüzden en güncel hâli için kaynak bağlantılarına bak.























