Как выбрать между RAG и дообучением для бизнеса — AI Flow

«Обучить нейросеть» или подключить базу знаний? Считаем деньги для малого бизнеса

Время чтения: ~5 мин.

Содержание:

Два пути: Шпаргалка (RAG) или Зубрёжка (Fine-tuning)
Сколько это стоит на самом деле: Считаем деньги
Стартовые расходы (CAPEX)
Ежемесячные траты (OPEX)
Главная проблема: Что делать, когда изменились цены?
Скорость и качество: Когда RAG проигрывает (спойлер: редко)
Практическая стратегия: С чего начать при бюджете до 100к₽
Частые вопросы
Итог

«Хочу обучить ChatGPT на своих данных, чтобы он отвечал как наш лучший менеджер». С этой фразой ко мне приходит каждый второй клиент. Обычно это владелец интернет-магазина, небольшой юридической фирмы или студии дизайна. Бюджет — 50-100 тысяч рублей, сроки — «вчера», а в штате из технарей — только сисадмин на аутсорсе.

И почти всегда клиент уверен: чтобы ИИ знал его прайс-лист, модель нужно именно дообучать (Fine-tuning).

Я обычно отвечаю: «Вам это не нужно. Не тратьте деньги».

В корпоративном мире консультанты любят рисовать сложные графики и сыпать терминами вроде CAPEX и OPEX. Но когда у вас в компании 15 человек, а не 1500, эти графики не работают. Давайте разберёмся по-простому: что выбрать малому бизнесу, сколько это реально стоит и почему «обучение» модели может стать черной дырой для вашего бюджета.

Два пути: Шпаргалка (RAG) или Зубрёжка (Fine-tuning)

Чтобы понять разницу, забудьте про IT-термины. Представьте, что вы нанимаете нового сотрудника, стажёра Васю, отвечать на звонки.

Вариант 1: RAG (Retrieval Augmented Generation).
Вы даёте Васе толстую папку с инструкциями, прайс-листами и историей переписки. Когда клиент задаёт вопрос, Вася открывает папку, находит нужную страницу, читает и отвечает.

Суть: Модель каждый раз «подглядывает» в ваши документы.
Для кого: Для 95% малого бизнеса.

Вариант 2: Fine-tuning (Дообучение).
Вы запираете Васю в библиотеке на месяц и заставляете выучить все ваши инструкции наизусть. Папку отбираете. Теперь он отвечает по памяти.

Суть: Вы меняете «мозги» модели, внедряя знания внутрь её весов.
Для кого: Для узких задач (медицина, специфический код), где важен стиль речи, а не только факты.

Сколько это стоит на самом деле: Считаем деньги

Бухгалтеры любят умные слова: CAPEX (первые вложения) и OPEX (ежемесячные траты). Проще говоря: сколько нужно выложить сразу и сколько придётся платить каждый месяц.

1. Стартовые расходы (CAPEX)

RAG (Шпаргалка):
Здесь всё демократично. Чтобы запустить бота, который ищет по вашей базе, не нужны суперкомпьютеры.

Что нужно: Собрать ваши файлы (Word, PDF, Excel) в кучу и настроить связь с нейросетью.
Цена вопроса: Если делать на конструкторах или простых скриптах, настройка займёт от пары дней до недели. У фрилансера или небольшой студии это стоит от 30к₽ до 80к₽.
Оборудование: Не нужно. Всё работает в облаке.

Fine-tuning (Зубрёжка):
Тут начинается боль. Чтобы «дообучить» модель, нужны данные в идеальном формате (вопрос-ответ). Просто скинуть папку с документами нельзя.

Что нужно: Подготовить тысячи пар примеров, арендовать мощные видеокарты (GPU) для тренировки, нанять ML-инженера, который будет следить, чтобы модель не «отупела».
Цена вопроса: Подготовка датасета и сама тренировка — это часы работы квалифицированного спеца. Ценник легко улетает за 150-200к₽ только за первый прогон.
Реальность: Если у вас нет штатного программиста, это сложно реализовать качественно. Вы заплатите за процесс, а результат может быть хуже базовой модели.

По опыту: Один клиент с бюджетом 100к₽ пытался заказать Fine-tuning. Потратил 80% бюджета на очистку данных, а на саму настройку денег не хватило. В итоге мы сделали ему RAG за 20к₽, и он счастлив.

2. Ежемесячные траты (OPEX)

RAG:
Вы платите за каждый запрос к нейросети + небольшую сумму за хранение вашей базы знаний.

Цена: Для компании с 50 обращениями в день это выйдет примерно в 2-5 тысяч рублей в месяц (оплата API OpenAI/Claude или российских аналогов).
Плюс: Если заявок нет — вы почти ничего не платите.

Fine-tuning:
Здесь кроется подвох. Хостинг (содержание) собственной дообученной модели стоит дороже.

Цена: Использование кастомной модели часто тарифицируется выше. Плюс вам всё равно нужен человек, который будет присматривать за системой.
Риск: Если вы дообучили модель с ошибкой, придётся переделывать всё заново (см. пункт про стартовые расходы).

Главная проблема: Что делать, когда изменились цены?

Это тот момент, о котором забывают 9 из 10 предпринимателей на старте.

Представьте: у вас интернет-магазин, и с понедельника цены выросли на 10%.

Сценарий RAG:
Вы (или ваш менеджер) открываете файл с прайсом, меняете цифры, сохраняете. Всё. Бот через минуту отвечает новыми ценами.

Время: 5 минут.
Стоимость: 0 рублей.

Сценарий Fine-tuning:
Модель «выучила» старые цены. Чтобы она узнала новые, её нужно переучивать.

Процесс: Собрать новый датасет -> Запустить тренировку -> Протестировать.
Время: Неделя.
Стоимость: Оплата работы инженера + вычислительные мощности.
Результат: Пока вы переучиваете модель, она неделю врёт клиентам про старые цены.

Честно говоря, для малого бизнеса это часто избыточно. Динамика у нас бешеная: сегодня акция, завтра новый поставщик. RAG позволяет менять данные на лету. Fine-tuning — это как высечь информацию в камне. Красиво, но попробуйте исправить опечатку.

Скорость и качество: Когда RAG проигрывает (спойлер: редко)

Давайте честно о минусах.

Аналитики пишут, что RAG работает медленнее. Почему? Потому что системе нужно сначала найти информацию в базе (поиск), а потом передать её нейросети (генерация). Fine-tuning отвечает сразу.

Насколько это критично?

Fine-tuning ответит за 1 секунду.
RAG ответит за 3-5 секунд.

Вопрос: Если клиент пишет вам в WhatsApp в 9 вечера, ему важно получить ответ через секунду или через 5 секунд? Ему важно получить правильный ответ. Для малого бизнеса эта задержка несущественна.

Где Fine-tuning реально нужен:

Стиль общения: Если бот должен отвечать как дерзкий пират или строгий юрист, и RAG с этим не справляется (хотя современные промпты решают и это).
Узкая специфика: Например, вы занимаетесь сложной химией, и базовая модель просто не понимает терминов, даже если ей дать словарь.
Экономия на масштабе: Если у вас 100 000 запросов в день, Fine-tuning может выйти дешевле в пересчёте на один запрос. Но если у вас такой трафик, вы вряд ли читаете эту статью как малый бизнес.

Практическая стратегия: С чего начать при бюджете до 100к₽

Если у вас команда до 50 человек и нет лишних миллионов, забудьте про «обучение» модели в техническом смысле. Вот ваш план действий:

Начните с RAG. Это стандарт индустрии для малого бизнеса в 2024-2025 годах.
Приведите в порядок базу знаний. Никакой ИИ не поможет, если у вас прайс в голове у собственника, а условия доставки — на стикере у менеджера. Соберите всё в Notion, Google Docs или хотя бы в один Word-файл.
Посчитайте экономику. Запуск простого бота с базой знаний обойдётся примерно в 30-50к₽ разово (настройка) и пару тысяч рублей в месяц на поддержку.
Тестируйте. Запустите бота на неделю. Если он отвечает правильно в 80% случаев — это победа. Оставшиеся 20% докручивайте улучшением инструкций, а не переобучением модели.

Внимание: При малом объёме запросов (до 50-100 в день) попытка внедрить собственную дообученную модель не окупится никогда. Вы просто сожжёте деньги на серверах и зарплатах инженеров.

Частые вопросы

Можно ли обойтись вообще без программиста?

С RAG — да. Сейчас есть много сервисов (No-code), куда можно просто загрузить PDF-файл, и бот готов. Качество будет средним, но для старта пойдёт. С Fine-tuning без инженера вы не справитесь — там нужен код, понимание весов, эпох обучения и валидации.

Сколько это будет стоить для компании на 15 человек (турагентство)?

Если мы говорим про RAG-бота для помощи менеджерам: настройка «под ключ» у частного специалиста — около 44-60к₽. Ежемесячные расходы на API (при активной работе) — около 3-5к₽. Если хотите внедрить это в CRM — добавьте ещё 20-30к₽ за интеграцию.

Что делать, если бюджет ограничен 100к₽?

Категорически только RAG. На эти деньги вы сможете сделать качественную базу знаний, настроить хорошего бота и оплатить его работу на год вперёд. Fine-tuning съест этот бюджет ещё на этапе подготовки данных.

Окупится ли это при 50 клиентах в день?

Давайте считать. Если бот сэкономит менеджеру 2 часа в день (ответы на типовые вопросы «где офис», «сколько стоит»), это 40 часов в месяц. При зарплате менеджера 60к₽, вы экономите около 15к₽ в месяц. Система за 50к₽ окупится за 3-4 месяца. Это отличный показатель.

Итог

Для малого бизнеса выбор между RAG и Fine-tuning — это выбор между покупкой удобного справочника и попыткой заставить сотрудника выучить энциклопедию наизусть.

RAG (База знаний):

✅ Дешевый старт (от 30к₽)
✅ Легко обновлять данные (просто замените файл)
✅ Не нужен штат программистов
❌ Чуть медленнее (на пару секунд)

Fine-tuning (Дообучение):

❌ Дорогой старт (от 150к₽)
❌ Сложно обновлять (нужно переучивать)
❌ Нужен ML-инженер
✅ Чуть быстрее и точнее в специфических задачах

Мой совет: не усложняйте. Начните с подключения базы знаний. В 99% случаев этого достаточно, чтобы снять рутину с сотрудников и перестать терять клиентов в нерабочее время. Не ждите чудес в первый месяц, но ждите реальной экономии времени.

Больше практических кейсов по автоматизации для малого бизнеса и разборов реальных смет — в моём канале @flowofai. Заходите, там мы говорим на человеческом языке, а не на языке корпораций.