Урок 6 · Архитектура · ~13 минут

Память агентов: как «помнить» то, чего нет в окне

⌂ Все уроки · Актуально на 10 июня 2026 · источники — в тексте · термины — в глоссарии · ← урок 5

Главная мысль урока: у модели нет памяти вообще — каждый вызов начинается с чистого листа. Всё, что выглядит как «агент меня помнит», — это инженерия: важное записано вне окна (чаще всего — в обычные файлы) и подгружается обратно в нужный момент. Стандарт 2026: память агента — это файлы и заметки, а не нейросеть, которая «запомнила».

Неудобная правда: модель — амнезик

Из урока 2 вы знаете: на каждом витке цикла модели заново отправляют всё контекстное окно. Между вызовами модель не хранит ничего. Когда Claude Code «помнит», что вы любите короткие коммиты, — это не воспоминание, а строчка в файле, которую ему молча подложили в системный промпт.

Отсюда инженерная постановка задачи: память агента = что записывать, куда, и когда подгружать обратно. Разложим по слоям — от секунд до месяцев.

Три слоя памяти

Слой 1 · Рабочая память: само окно

Всё, что произошло в текущей сессии, лежит в контексте — это и есть краткосрочная память. Её ограничения вы знаете: конечна, дорожает с каждым токеном, деградирует (context rot). Когда окно переполняется, срабатывает компакция: история сжимается в сводку. Важная деталь: компакция — это потеря информации. Сводка сохраняет суть, но детали умирают.

Слой 2 · Заметки по ходу задачи: файлы как блокнот

Агент, работающий над долгой задачей, записывает важное в файлы по ходу работы: план в TODO.md, выводы в заметки, прогресс в журнал. Файл переживает и компакцию, и крах сессии — агент перечитает его и продолжит.

Manus (один из самых известных автономных агентов) называет файловую систему «внешней памятью агента» и использует приём «проговаривание цели»: агент постоянно переписывает todo-список в конец контекста, чтобы не потерять цель в длинной задаче. (Manus, Context Engineering Lessons, июль 2025)

Вы видите этот слой каждый день: когда Claude Code ведёт TODO-список или пишет session_summary — это оно.

🔬 Под капотом: почему todo-список переписывают именно в конец

Модель — как собеседник в долгом разговоре: лучше всего помнит то, что сказано только что, и то, с чего всё началось, а середина «плывёт» (тот же эффект «lost in the middle» из урока 2).

Переписывая список целей в конец контекста, агент держит цель в самой «свежей» зоне внимания модели. Это не специальная функция, а простой приём: повторяй важное последним — и оно не потеряется.

Слой 3 · Долгосрочная память: знания между сессиями

То, что должно жить недели и месяцы: предпочтения пользователя, история проекта, выученные уроки. Реализации:

CLAUDE.md — «конституция» проекта: правила и факты, которые подкладываются агенту в начале каждой сессии. Самая простая долгосрочная память — и часто достаточная.
Memory tool — с сентября 2025 встроенная возможность Claude API: агент сам ведёт файлы памяти (создаёт, читает, обновляет) в специальной директории, переживающей сессии. В связке с автоочисткой старых результатов это дало +39% качества на агентных задачах. (Anthropic, Managing Context, сент. 2025; доки memory tool)
Специализированные системы памяти (Mem0, Letta, Zep) — отдельные сервисы, которые извлекают факты из диалогов, обновляют их и подмешивают релевантное. Это «для роста»: тысячи пользователей, у каждого своя история. Для одного бизнес-ассистента файловой памяти обычно достаточно. (State of AI Agent Memory 2026, апр. 2026)

Как слои работают вместе

	Живёт	Что хранит	Пример у вас
Окно	одну сессию	текущий диалог и результаты действий	всё, что произошло в сессии Claude Code
Заметки задачи	дни (пока идёт задача)	план, прогресс, промежуточные выводы	TODO.md, session_summary.md
Долгосрочная	месяцы	правила, предпочтения, история	CLAUDE.md, файлы memory/, скиллы

Рабочий паттерн 2026 сформулирован в доках Anthropic: компакция держит активный контекст управляемым, память переносит важное через границы компакции. Они не конкуренты, а конвейер: окно → заметки → долгосрочные файлы. (доки memory tool)

И заметьте, чего в этой картине нет: векторной базы. В 2023–2024 «память агента» почти всегда означала «складываем диалоги в векторную базу и ищем похожее».

К 2026 индустрия пришла к более простой модели: память — это структурированные заметки в файлах, которые агент сам пишет и перечитывает. Векторный поиск по памяти остался для особых случаев (огромные истории, миллионы пользователей) — ровно как RAG в уроке 4.

Зачем это вам как заказчику

«Что ассистент будет помнить о клиенте через месяц и где это хранится?» — правильный ответ указывает на конкретное хранилище (файлы, базу) и правила обновления, а не «модель запомнит».
«Что происходит с памятью, когда факт устарел?» — клиент сменил тариф, а память помнит старый. Устаревание — главная нерешённая проблема памяти агентов; в хорошей архитектуре есть перезапись фактов, а не вечное накопление. (Mem0, 2026)
«Память общая или на каждого клиента своя?» — заметки о клиенте А не должны всплывать в разговоре с клиентом Б. Это вопрос и приватности, и качества.

Проверьте себя

Повторение урока 5. Нужно проанализировать 50 отзывов о курсе и выделить темы. Какой паттерн и почему?

Верно, урок 5 усвоен! Чтение параллелится отлично: «читаем много → параллелим, пишем одно → один агент».

Вспомните правило урока 5: анализ 50 отзывов — это «читаем много», идеальный профиль для оркестратора с воркерами. Write-ограничение касается создания единого произведения.

Claude Code в новой сессии «помнит», что вы предпочитаете pnpm вместо npm. Откуда?

Именно! Модель не дообучается на вас и ничего не хранит между вызовами. «Память» = файл + подгрузка в контекст. Загляните в свой ~/.claude/CLAUDE.md — вся «личность» вашего Claude там.

Модель не дообучается на пользователях и не хранит ничего между вызовами (урок 2). Единственный механизм — записать в файл и подложить в контекст. Проверьте свой CLAUDE.md!

Что теряется при компакции?

Верно! Поэтому важное надо записывать в файлы ДО компакции — файл переживёт её, а деталь в истории — нет. Это и есть связка «компакция + заметки».

Компакция — не ZIP и не обнуление: история заменяется краткой сводкой. Суть остаётся, детали теряются. Лекарство: важное — в файлы, они компакцию переживают.

Вы заказываете ассистента наставника: он ведёт 30 учеников месяцами и должен помнить прогресс каждого. Разработчик говорит: «складываем все диалоги в векторную базу, при разговоре ищем похожее». Ваш вопрос?

Отлично! «Похожие куски старых диалогов» — это память образца 2023: она тащит устаревшие факты и обрывки без контекста. Стандарт 2026 — структурированные заметки (профиль ученика, прогресс, договорённости) с перезаписью устаревшего. 30 учеников — это 30 файлов, не миллион записей.

Тип базы — не главный вопрос. Главное: поиск похожего по старым диалогам тащит устаревшие и вырванные из контекста факты. Для 30 учеников проще и качественнее — структурированные заметки на каждого с обновлением фактов.

Практика: загляните в память своего Claude

🛠 Задание на 7 минут

Откройте свой глобальный файл памяти: ~/.claude/CLAUDE.md — это слой 3, «конституция», которую ваш Claude получает в каждой сессии. Перечитайте: всё ли там актуально? Устаревшие правила — та самая проблема «протухшей памяти».
Найдите слой 2 в действии: в любом рабочем проекте посмотрите на TODO.md или session_summary.md — это заметки, переживающие сессию.
Эксперимент: скажите Claude Code в этой учебной папке: «Запомни на будущее: [любой факт о ваших предпочтениях в обучении]» — и посмотрите, куда он это запишет (подсказка: в NOTES.md). В следующей сессии он это «вспомнит» — теперь вы знаете, как именно.
Контрольный вопрос себе: для моего будущего приложения — что агент должен помнить через месяц, и в какой из трёх слоёв это ложится?

Что дальше

Следующий урок — качество и evals: как вообще понять, что агентная система работает хорошо? Почему «вроде нормально отвечает» — путь к катастрофе, что такое error analysis и LLM-судья, и какой минимум контроля качества заказывать вместе с приложением.