⌂ Все уроки · Справочник блока 2 · версия от 11 июня 2026 · используется в финале блока 2 (урок 16) и в каждом реальном заказе ассистента по базе знаний
💡 Как пользоваться: проходите разделы сверху вниз при составлении ТЗ и на каждой встрече с разработчиком. Под каждым разделом — 🚩 красный флаг: ответ, после которого стоит насторожиться.
Сколько в базе страниц/токенов? Если меньше ~500 страниц (~200K токенов) — RAG не нужен: вся база в промпт + кэширование.
Сколько запросов в день и кто спрашивает? Единицы-десятки от своей команды — рассмотрен ли агентный поиск по файлам (ноль инфраструктуры, урок 15)? RAG оправдан, когда запросов много и каждый ответ должен быть быстрым и дешёвым.
Если RAG не нужен — предложено ли решение проще (длинный контекст или агентный поиск)?
🚩 «RAG нужен всем, это стандарт» — без вопросов о размере базы и числе запросов в день. И зеркальный флаг: «RAG устарел, делаем агентный поиск» — для сервиса на сотни клиентских запросов в день.
1. Подготовка базы · урок 11
Кто и когда вычищает из базы устаревшие версии, черновики, дубли? (Это ваша работа — но процесс должен быть.)
Как парсятся PDF? Что происходит с таблицами — сохраняются со структурой (structure-aware парсер) или расплющиваются в текст?
Как происходит обновление: добавили документ — что дальше и сколько стоит?
🚩 «Извлечём текст обычной библиотекой» — при базе, где есть таблицы тарифов и программ.
2. Нарезка · урок 11
Какой размер чанков и почему? (Ориентир 2026: 256–512 токенов для фактов, резка по структуре документа.)
Как чанки сохраняют контекст документа: contextual retrieval (LLM дописывает контекст) или late chunking?
Тестировались ли 2–3 стратегии нарезки на наших документах с цифрами?
🚩 «Нарежем по 1000 символов с перекрытием, как все» — рецепт туториалов 2023 года.