Урок 6 · Архитектура · ~13 минут

Память агентов: как «помнить» то, чего нет в окне

⌂ Все уроки · Актуально на 10 июня 2026 · источники — в тексте · термины — в глоссарии · ← урок 5
Главная мысль урока: у модели нет памяти вообще — каждый вызов начинается с чистого листа. Всё, что выглядит как «агент меня помнит», — это инженерия: важное записано вне окна (чаще всего — в обычные файлы) и подгружается обратно в нужный момент. Стандарт 2026: память агента — это файлы и заметки, а не нейросеть, которая «запомнила».

Неудобная правда: модель — амнезик

Из урока 2 вы знаете: на каждом витке цикла модели заново отправляют всё контекстное окно. Между вызовами модель не хранит ничего. Когда Claude Code «помнит», что вы любите короткие коммиты, — это не воспоминание, а строчка в файле, которую ему молча подложили в системный промпт.

Отсюда инженерная постановка задачи: память агента = что записывать, куда, и когда подгружать обратно. Разложим по слоям — от секунд до месяцев.

Три слоя памяти

Слой 1 · Рабочая память: само окно

Всё, что произошло в текущей сессии, лежит в контексте — это и есть краткосрочная память. Её ограничения вы знаете: конечна, дорожает с каждым токеном, деградирует (context rot). Когда окно переполняется, срабатывает компакция: история сжимается в сводку. Важная деталь: компакция — это потеря информации. Сводка сохраняет суть, но детали умирают.

Слой 2 · Заметки по ходу задачи: файлы как блокнот

Агент, работающий над долгой задачей, записывает важное в файлы по ходу работы: план в TODO.md, выводы в заметки, прогресс в журнал. Файл переживает и компакцию, и крах сессии — агент перечитает его и продолжит.

Manus (один из самых известных автономных агентов) называет файловую систему «внешней памятью агента» и использует приём «проговаривание цели»: агент постоянно переписывает todo-список в конец контекста, чтобы не потерять цель в длинной задаче. (Manus, Context Engineering Lessons, июль 2025)

Вы видите этот слой каждый день: когда Claude Code ведёт TODO-список или пишет session_summary — это оно.

🔬 Под капотом: почему todo-список переписывают именно в конец

Модель — как собеседник в долгом разговоре: лучше всего помнит то, что сказано только что, и то, с чего всё началось, а середина «плывёт» (тот же эффект «lost in the middle» из урока 2).

Переписывая список целей в конец контекста, агент держит цель в самой «свежей» зоне внимания модели. Это не специальная функция, а простой приём: повторяй важное последним — и оно не потеряется.

Слой 3 · Долгосрочная память: знания между сессиями

То, что должно жить недели и месяцы: предпочтения пользователя, история проекта, выученные уроки. Реализации:

Как слои работают вместе

ЖивётЧто хранитПример у вас
Окноодну сессиютекущий диалог и результаты действийвсё, что произошло в сессии Claude Code
Заметки задачидни (пока идёт задача)план, прогресс, промежуточные выводыTODO.md, session_summary.md
Долгосрочнаямесяцыправила, предпочтения, историяCLAUDE.md, файлы memory/, скиллы

Рабочий паттерн 2026 сформулирован в доках Anthropic: компакция держит активный контекст управляемым, память переносит важное через границы компакции. Они не конкуренты, а конвейер: окно → заметки → долгосрочные файлы. (доки memory tool)

И заметьте, чего в этой картине нет: векторной базы. В 2023–2024 «память агента» почти всегда означала «складываем диалоги в векторную базу и ищем похожее».

К 2026 индустрия пришла к более простой модели: память — это структурированные заметки в файлах, которые агент сам пишет и перечитывает. Векторный поиск по памяти остался для особых случаев (огромные истории, миллионы пользователей) — ровно как RAG в уроке 4.

Зачем это вам как заказчику

Проверьте себя

Повторение урока 5. Нужно проанализировать 50 отзывов о курсе и выделить темы. Какой паттерн и почему?

Claude Code в новой сессии «помнит», что вы предпочитаете pnpm вместо npm. Откуда?

Что теряется при компакции?

Вы заказываете ассистента наставника: он ведёт 30 учеников месяцами и должен помнить прогресс каждого. Разработчик говорит: «складываем все диалоги в векторную базу, при разговоре ищем похожее». Ваш вопрос?

Практика: загляните в память своего Claude

🛠 Задание на 7 минут

  1. Откройте свой глобальный файл памяти: ~/.claude/CLAUDE.md — это слой 3, «конституция», которую ваш Claude получает в каждой сессии. Перечитайте: всё ли там актуально? Устаревшие правила — та самая проблема «протухшей памяти».
  2. Найдите слой 2 в действии: в любом рабочем проекте посмотрите на TODO.md или session_summary.md — это заметки, переживающие сессию.
  3. Эксперимент: скажите Claude Code в этой учебной папке: «Запомни на будущее: [любой факт о ваших предпочтениях в обучении]» — и посмотрите, куда он это запишет (подсказка: в NOTES.md). В следующей сессии он это «вспомнит» — теперь вы знаете, как именно.
  4. Контрольный вопрос себе: для моего будущего приложения — что агент должен помнить через месяц, и в какой из трёх слоёв это ложится?

Что дальше

Следующий урок — качество и evals: как вообще понять, что агентная система работает хорошо? Почему «вроде нормально отвечает» — путь к катастрофе, что такое error analysis и LLM-судья, и какой минимум контроля качества заказывать вместе с приложением.