Главная мысль урока: у модели нет памяти вообще — каждый вызов начинается с чистого листа. Всё, что выглядит как «агент меня помнит», — это инженерия: важное записано вне окна (чаще всего — в обычные файлы) и подгружается обратно в нужный момент. Стандарт 2026: память агента — это файлы и заметки, а не нейросеть, которая «запомнила».
Неудобная правда: модель — амнезик
Из урока 2 вы знаете: на каждом витке цикла модели заново отправляют всё контекстное окно. Между вызовами модель не хранит ничего. Когда Claude Code «помнит», что вы любите короткие коммиты, — это не воспоминание, а строчка в файле, которую ему молча подложили в системный промпт.
Отсюда инженерная постановка задачи: память агента = что записывать, куда, и когда подгружать обратно. Разложим по слоям — от секунд до месяцев.
Три слоя памяти
Слой 1 · Рабочая память: само окно
Всё, что произошло в текущей сессии, лежит в контексте — это и есть краткосрочная память. Её ограничения вы знаете: конечна, дорожает с каждым токеном, деградирует (context rot). Когда окно переполняется, срабатывает компакция: история сжимается в сводку. Важная деталь: компакция — это потеря информации. Сводка сохраняет суть, но детали умирают.
Слой 2 · Заметки по ходу задачи: файлы как блокнот
Агент, работающий над долгой задачей, записывает важное в файлы по ходу работы: план в TODO.md, выводы в заметки, прогресс в журнал. Файл переживает и компакцию, и крах сессии — агент перечитает его и продолжит.
Manus (один из самых известных автономных агентов) называет файловую систему «внешней памятью агента» и использует приём «проговаривание цели»: агент постоянно переписывает todo-список в конец контекста, чтобы не потерять цель в длинной задаче. (Manus, Context Engineering Lessons, июль 2025)
Вы видите этот слой каждый день: когда Claude Code ведёт TODO-список или пишет session_summary — это оно.
🔬 Под капотом: почему todo-список переписывают именно в конец
Модель — как собеседник в долгом разговоре: лучше всего помнит то, что сказано только что, и то, с чего всё началось, а середина «плывёт» (тот же эффект «lost in the middle» из урока 2).
Переписывая список целей в конец контекста, агент держит цель в самой «свежей» зоне внимания модели. Это не специальная функция, а простой приём: повторяй важное последним — и оно не потеряется.
Слой 3 · Долгосрочная память: знания между сессиями
То, что должно жить недели и месяцы: предпочтения пользователя, история проекта, выученные уроки. Реализации:
CLAUDE.md — «конституция» проекта: правила и факты, которые подкладываются агенту в начале каждой сессии. Самая простая долгосрочная память — и часто достаточная.
Memory tool — с сентября 2025 встроенная возможность Claude API: агент сам ведёт файлы памяти (создаёт, читает, обновляет) в специальной директории, переживающей сессии. В связке с автоочисткой старых результатов это дало +39% качества на агентных задачах. (Anthropic, Managing Context, сент. 2025; доки memory tool)
Специализированные системы памяти (Mem0, Letta, Zep) — отдельные сервисы, которые извлекают факты из диалогов, обновляют их и подмешивают релевантное. Это «для роста»: тысячи пользователей, у каждого своя история. Для одного бизнес-ассистента файловой памяти обычно достаточно. (State of AI Agent Memory 2026, апр. 2026)
Как слои работают вместе
Живёт
Что хранит
Пример у вас
Окно
одну сессию
текущий диалог и результаты действий
всё, что произошло в сессии Claude Code
Заметки задачи
дни (пока идёт задача)
план, прогресс, промежуточные выводы
TODO.md, session_summary.md
Долгосрочная
месяцы
правила, предпочтения, история
CLAUDE.md, файлы memory/, скиллы
Рабочий паттерн 2026 сформулирован в доках Anthropic: компакция держит активный контекст управляемым, память переносит важное через границы компакции. Они не конкуренты, а конвейер: окно → заметки → долгосрочные файлы. (доки memory tool)
И заметьте, чего в этой картине нет: векторной базы. В 2023–2024 «память агента» почти всегда означала «складываем диалоги в векторную базу и ищем похожее».
К 2026 индустрия пришла к более простой модели: память — это структурированные заметки в файлах, которые агент сам пишет и перечитывает. Векторный поиск по памяти остался для особых случаев (огромные истории, миллионы пользователей) — ровно как RAG в уроке 4.
Зачем это вам как заказчику
«Что ассистент будет помнить о клиенте через месяц и где это хранится?» — правильный ответ указывает на конкретное хранилище (файлы, базу) и правила обновления, а не «модель запомнит».
«Что происходит с памятью, когда факт устарел?» — клиент сменил тариф, а память помнит старый. Устаревание — главная нерешённая проблема памяти агентов; в хорошей архитектуре есть перезапись фактов, а не вечное накопление. (Mem0, 2026)
«Память общая или на каждого клиента своя?» — заметки о клиенте А не должны всплывать в разговоре с клиентом Б. Это вопрос и приватности, и качества.
Проверьте себя
Повторение урока 5. Нужно проанализировать 50 отзывов о курсе и выделить темы. Какой паттерн и почему?
Верно, урок 5 усвоен! Чтение параллелится отлично: «читаем много → параллелим, пишем одно → один агент».
Вспомните правило урока 5: анализ 50 отзывов — это «читаем много», идеальный профиль для оркестратора с воркерами. Write-ограничение касается создания единого произведения.
Claude Code в новой сессии «помнит», что вы предпочитаете pnpm вместо npm. Откуда?
Именно! Модель не дообучается на вас и ничего не хранит между вызовами. «Память» = файл + подгрузка в контекст. Загляните в свой ~/.claude/CLAUDE.md — вся «личность» вашего Claude там.
Модель не дообучается на пользователях и не хранит ничего между вызовами (урок 2). Единственный механизм — записать в файл и подложить в контекст. Проверьте свой CLAUDE.md!
Что теряется при компакции?
Верно! Поэтому важное надо записывать в файлы ДО компакции — файл переживёт её, а деталь в истории — нет. Это и есть связка «компакция + заметки».
Компакция — не ZIP и не обнуление: история заменяется краткой сводкой. Суть остаётся, детали теряются. Лекарство: важное — в файлы, они компакцию переживают.
Вы заказываете ассистента наставника: он ведёт 30 учеников месяцами и должен помнить прогресс каждого. Разработчик говорит: «складываем все диалоги в векторную базу, при разговоре ищем похожее». Ваш вопрос?
Отлично! «Похожие куски старых диалогов» — это память образца 2023: она тащит устаревшие факты и обрывки без контекста. Стандарт 2026 — структурированные заметки (профиль ученика, прогресс, договорённости) с перезаписью устаревшего. 30 учеников — это 30 файлов, не миллион записей.
Тип базы — не главный вопрос. Главное: поиск похожего по старым диалогам тащит устаревшие и вырванные из контекста факты. Для 30 учеников проще и качественнее — структурированные заметки на каждого с обновлением фактов.
Практика: загляните в память своего Claude
🛠 Задание на 7 минут
Откройте свой глобальный файл памяти: ~/.claude/CLAUDE.md — это слой 3, «конституция», которую ваш Claude получает в каждой сессии. Перечитайте: всё ли там актуально? Устаревшие правила — та самая проблема «протухшей памяти».
Найдите слой 2 в действии: в любом рабочем проекте посмотрите на TODO.md или session_summary.md — это заметки, переживающие сессию.
Эксперимент: скажите Claude Code в этой учебной папке: «Запомни на будущее: [любой факт о ваших предпочтениях в обучении]» — и посмотрите, куда он это запишет (подсказка: в NOTES.md). В следующей сессии он это «вспомнит» — теперь вы знаете, как именно.
Контрольный вопрос себе: для моего будущего приложения — что агент должен помнить через месяц, и в какой из трёх слоёв это ложится?
Что дальше
Следующий урок — качество и evals: как вообще понять, что агентная система работает хорошо? Почему «вроде нормально отвечает» — путь к катастрофе, что такое error analysis и LLM-судья, и какой минимум контроля качества заказывать вместе с приложением.