Урок 15 · Блок 2 · ~14 минут

Агентный поиск: ассистент без конвейера

⌂ Все уроки · Актуально на 11 июня 2026 · источники — в тексте · термины — в глоссарии · ← урок 14

Главная мысль урока: агентный поиск — это второй взрослый способ работать с базой, которая не лезет в контекст. Никакого индекса: агент ищет по файлам сам, в цикле. Урок 4 показал, что для малых живых баз он часто бьёт RAG; блок 2 показал, где RAG незаменим. Этот урок сводит обе правды в одну: решает не размер базы, а нагрузка — сколько запросов в день и кто ждёт ответа. Единое дерево — в справочнике выбора.

Сначала честно: где курс вас запутал

В уроке 4 мы сказали: «векторная база перестала быть обязательной», Anthropic выбрала для Claude Code агентный поиск — и он «победил с большим отрывом». А потом целый блок строили RAG. Выглядит как противоречие, и вопрос «так что же выбирать?» — законный.

Разгадка в том, что у этих историй разная нагрузка. Claude Code — инструмент одного человека: десятки запросов в день, пользователь готов подождать полминуты, код меняется ежеминутно. Ассистент школы — сервис для сотен учеников: ответ нужен за секунды, и платить «агентскую» цену за каждый из сотен ответов разорительно.

Запомните формулу: агентный поиск — инструмент для своих, RAG — сервис для толпы. Дальше разберём, почему это так с точностью до денег.

Как он устроен: agent loop, применённый к поиску

Вспомните цикл из урока 1: модель думает → зовёт инструмент → смотрит результат → думает дальше. Агентный поиск — этот же цикл, где инструменты — простейшие: поиск по словам в файлах (grep), просмотр списка файлов, чтение найденного.

вопрос → ищу «возврат» → 12 файлов → открываю регламент → там ссылка на приложение 2 → открываю его → собираю ответ

Ключевое отличие от RAG: в RAG поиск — один заранее настроенный шаг конвейера. Здесь поиском управляет сама модель: не нашла — переформулирует, нашла обрывок — пойдёт по ссылке в соседний документ, усомнилась — перепроверит. Слабость инструмента (grep ищет только точные слова) компенсируется умом того, кто им пользуется.

🔬 Под капотом: почему grep без «карты смыслов» вообще работает

Векторный поиск понимает перефразировки («вернуть деньги» ≈ «процедура возврата средств»), а grep — нет. Казалось бы, агентный поиск должен проигрывать разгромно. Но синонимы знает сама модель: не нашла по «возврат» — попробует «refund», «аннулирование», «отмена заказа». Карта смыслов размазана по витку цикла.

Исследование мая 2026 на реальных корпусах это подтвердило: агент с поиском по ключевым словам достигает 90%+ качества полноценного RAG-конвейера. Цена — токены: каждая попытка, каждый прочитанный файл, каждое «подумаю ещё» оплачивается. (Is Grep All You Need?, arXiv, май 2026)

Отсюда и потолок: на огромных базах (сотни тысяч документов) перебор «поищу так, поищу эдак» буксует — индекс, который сузил поле за миллисекунды, становится незаменим.

Экономика: за что платим в каждом из миров

RAG: дорогой вход, дешёвый ответ

Платите за конвейер заранее: парсинг, нарезка, индексация, инфраструктура ($20–80/мес для школы, урок 14). Зато каждый ответ — один поиск + одна генерация: секунды и копейки.

Агентный поиск: бесплатный вход, дорогой ответ

Входа нет вообще: положили файлы в папку — работает. Зато каждый ответ — несколько витков цикла: в разы больше токенов и десятки секунд ожидания.

Теперь видно, где экономика переворачивается: при единицах-десятках запросов в день дорогая цена ответа незаметна, а отсутствие инфраструктуры — счастье. При сотнях запросов в день дорогие ответы складываются в разорительный счёт, а вложение в конвейер размазывается и окупается.

Это та же логика, что у такси и личного авто: ездите дважды в месяц — такси (платите за поездку), ездите каждый день — своя машина (платите за владение). Спорить «что лучше» без вопроса «сколько ездите» бессмысленно.

Бонус, который часто решает: свежесть

У RAG между документом и ответом стоит индекс. Обновили тариф — пока не переиндексировали, ассистент цитирует старый (помните сценарий из урока 13?). Процесс обновления — отдельная работа и статья бюджета (урок 14).

Агентный поиск читает оригиналы. Поправили файл — следующий же ответ опирается на новую версию. Для баз, которые меняются ежедневно (переписки, код, рабочие документы запуска), это не бонус, а решающий аргумент: индекс устаревал бы быстрее, чем переиндексируется.

Именно поэтому Claude Code работает без индекса: Anthropic пробовала векторную базу по коду — агентный поиск победил «с большим отрывом», в том числе потому, что код меняется при каждом сохранении файла. (разбор с цитатами создателя Claude Code, март 2026)

Как это собрать — буквально за вечер

Для внутреннего помощника не нужен разработчик:

Папка с материалами. Регламенты, методички, описания тарифов — обычными файлами (Markdown, текст; PDF хуже — кривой парсинг никто не отменял, урок 11 действует и тут).
Гигиена имён. Агент ориентируется по названиям файлов и папок, как новый сотрудник: тарифы-2026.md найдётся, doc_final_v3(2).pdf — нет. Устаревшие версии — в архивную папку: мусор на входе портит и агентный поиск, не только RAG.
Claude Code в этой папке — и всё, ассистент готов: «найди, что мы обещали в условиях прошлого потока». Для команды то же самое упаковывается в приложение через Agent SDK — обвязку Anthropic, в которой этот цикл уже собран.

Сравните со сметой RAG-проекта из урока 14 — и станет ясно, почему дерево выбора велит начинать с простого пути.

Уровень выше: свяжите знания ссылками — получится граф

Папка с файлами — это полки. Следующий шаг — дорожные указатели: нарежьте знания на файлы по одной концепции и проставьте между ними обычные ссылки со смыслом: «опирается на…», «см. также…», «частный случай…». Так устроены базы заметок вроде Obsidian (метод Zettelkasten — «картотека»: одна мысль = одна карточка, карточки связаны).

Для агента это меняет всё. Без ссылок он блуждает: ищет по словам, гадает, где продолжение. Со ссылками — движется по маршруту: открыл файл про модуль курса, увидел «возражения разобраны в [vozrazheniya.md]» — пошёл туда. Тот же agent loop, но теперь структура базы подсказывает следующий шаг.

Получается граф знаний: узлы — файлы-концепции, рёбра — ссылки. Никакой инфраструктуры — граф живёт прямо в текстах. Добавьте файл-карту (оглавление со ссылками на главное) — это «вход» в граф, с которого агент начинает.

Кто строит граф: не обязательно вы руками

Связи и сами файлы может строить агент — по заданным вами правилам. Этот паттерн в марте 2026 показал Андрей Карпати (сооснователь OpenAI, экс-глава ИИ в Tesla), и его схема многих вдохновила. Он называет это компиляцией знаний: как компилятор превращает сырой код в работающую программу, агент превращает сырые материалы в организованную вики.

Устройство — три части. Папка raw/ — сырьё как есть: статьи, PDF, заметки, с дублями и мусором, его никто не причёсывает. Папка wiki/ — результат: агент читает сырьё и переписывает его в маленькие статьи-концепции — выделяет суть, убирает дублирование, перелинковывает статьи между собой, ведёт файл-индекс.

Третья часть — файл-схема с правилами (тот же формат, что CLAUDE.md): как структурировать статьи, как вливать новые источники, что делать с противоречиями. Именно схема превращает универсального агента в дисциплинированного хранителя вики.

Человек в этой системе — главный редактор, а не писарь: подкладывает сырьё и читает результат. У самого Карпати такая вики — ~100 статей на 400+ тысяч слов, и на вопросы агент отвечает без всякого RAG — агентным поиском по индексу и ссылкам. (разбор метода Карпати, апр. 2026; пересказ на русском)

Заметьте, как это ложится в экономику урока: компиляция — та же «индексация», разовая дорогая переработка. Только результат — не векторы в базе, а читаемые файлы, которые видно глазами и можно править.

Одна честная оговорка: агент при переписывании может упростить или исказить. Для бизнес-базы (тарифы, обещания клиентам) заложите выборочную сверку статей с сырьём — тот же принцип честности из урока 13.

🔬 Под капотом: граф ссылок ≠ GraphRAG из урока 12

Звучит похоже на GraphRAG — но это разные вещи. В GraphRAG граф строит машина: LLM прочитывает корпус, автоматически извлекает сущности и связи, складывает их в отдельную графовую базу данных. Отсюда его цена: извлечение сжигает токенов больше, чем весь корпус, ошибается, а базу надо обслуживать (урок 12: ниша, 3–5× дороже).

Граф ссылок — неважно, проставили вы их руками или построил агент-компилятор по вашей схеме — остаётся обычными файлами: его видно глазами, он правится в любом редакторе, инфраструктуры ноль, читает его агентный поиск. А по графовой базе GraphRAG ходят специальные запросы — как текст её не почитаешь.

И бонус на вырост: если нагрузка вырастет и придётся строить RAG, такая база — подарок для индексации. Чанки уже нарезаны по одной мысли, а контекст, который contextual retrieval дописывает за деньги (урок 11), у вас уже проставлен ссылками и заголовками.

🔬 Под капотом: агентный поиск ≠ агентный RAG

Похожие названия, разные вещи — их путают чаще всего. Агентный поиск (agentic search) — индекса нет вообще: агент ищет по живым файлам. Агентный RAG (agentic RAG, урок 14) — агент работает поверх готового RAG-конвейера: решает, в каком индексе искать, не переформулировать ли запрос, достаточно ли найденного.

То есть агентный RAG — это «RAG + мозги», апгрейд конвейера. А агентный поиск — «мозги вместо конвейера», его замена. В разговоре с разработчиком уточняйте, о чём речь: «агентный поиск по файлам, без индекса?» или «агент поверх векторной базы?» — это разные сметы и разные архитектуры.

Зачем это вам как заказчику

Прежде чем заказывать RAG, спросите себя: «сколько запросов в день и кто спрашивает?» Внутренний инструмент на десяток запросов — это вечер с Claude Code, а не трёхнедельный проект.
Если разработчик говорит «RAG устарел, сделаем агентный поиск» — тот же вопрос с другой стороны: «а потянет ли он наши сотни запросов в день по цене и скорости?»
Миграция — односторонняя: файлы → RAG легко (файлы станут источником индексации), RAG → файлы — выброшенные деньги. Начинайте с простого.
Пути не исключают друг друга: на масштабе их сочетают маршрутизацией (уроки 5 и 14) — основной поток простых вопросов идёт по дешёвому быстрому RAG-конвейеру, а сложные вопросы-цепочки — агентным маршрутом по той же базе. Платите агентскую цену только за вопросы, которые её стоят.
Спорный выбор сверяйте с деревом выбора — четыре вопроса, и спор закрыт.

Проверьте себя

Повторение урока 14. Что из этого — статья расходов, которой у агентного поиска НЕТ, а у RAG — есть всегда?

Верно! Агентный поиск читает оригиналы — обновление файла бесплатно. У RAG между документом и ответом индекс, и его актуальность — постоянная работа и статья бюджета (урок 14).

Генерацию и вопрос оплачивают оба пути. Различие — индекс: агентный поиск читает оригиналы (обновление бесплатно), RAG требует переиндексации — это статья бюджета из урока 14.

База материалов школы — 3000 страниц. Какой вопрос нужно задать ПЕРВЫМ, чтобы выбрать между агентным поиском и RAG?

Именно! Размер базы одинаково позволяет оба пути — разводит их нагрузка. Десяток внутренних запросов — агентный поиск; сотни внешних, где важны секунды — RAG. Это главная ось дерева выбора.

Рейтинги и прайсы — потом. Сначала нагрузка: для своей команды на десяток запросов в день строить конвейер незачем, а для сотен учеников агентный поиск слишком дорог и медлен на каждый ответ.

Разработчик: «RAG умер, Anthropic сама от него отказалась в Claude Code — делаем вам агентный поиск для чата поддержки на 400 вопросов в день». Что не так?

Верно! Вывод Anthropic честный, но для другой задачи. 400 вопросов в день от учеников — профиль RAG (или длинного контекста, если база мала): дешёвый и быстрый ответ важнее нулевой инфраструктуры.

«У Anthropic сработало» — не аргумент без сравнения профилей: один разработчик против сотен учеников, полминуты ожидания против секунд. Прогоните задачу через четыре вопроса дерева выбора.

Чем агентный поиск отличается от агентного RAG (урок 14)?

Точно! Замена конвейера против апгрейда конвейера. В разговоре с разработчиком всегда уточняйте, какой из двух имеется в виду — сметы различаются в разы.

Не синонимы: агентный поиск работает без индекса вообще (файлы + цикл), агентный RAG — агент поверх готового RAG-конвейера. Разные архитектуры, разные сметы.

Практика: соберите агентный поиск прямо сейчас

🛠 Задание на 15 минут

Создайте папку и положите туда 10–20 рабочих документов школы (регламенты, условия, описания курсов — лучше текстом или Markdown).
Откройте в этой папке Claude Code и задайте 5 реальных вопросов, на которые отвечают эти документы. Смотрите на процесс: как он ищет, что переформулирует, по каким файлам ходит — это и есть агентный поиск вживую.
Замерьте ощущения: сколько секунд занимал ответ? Все ли 5 верны со ссылкой на документ?
Финальный вопрос ему же: «Если такие вопросы будут задавать 300 учеников в день через сайт — останется ли агентный поиск правильной архитектурой? Посчитай и сравни с RAG». Сверьте его рассуждение с деревом выбора.

Что дальше

Теперь в руках обе архитектуры и дерево, которое их разводит. Финал блока — собрать всё в детальный раздел «Знания» вашего ТЗ: урок 16.