# Дообучение

<figure><img src="https://2593311972-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2Fef2EBU68XAlye1NtG8DF%2Fuploads%2FTAMj7xk9kOAC69ciIe8w%2Fimage.png?alt=media&#x26;token=a33163bc-3589-417d-86c8-126de65aa56f" alt=""><figcaption></figcaption></figure>

### **Что это такое?**

Дообучение (fine-tuning) — это процесс адаптации уже существующей модели ИИ под ваши конкретные задачи и потребности. Вместо того чтобы создавать модель с нуля, вы берёте готовую базовую модель (например, GPT) и дообучаете её на данных, специфичных для вашего бизнеса. Это позволяет модели лучше понимать вашу терминологию, контекст и сценарии, значительно повышая её полезность.

***

### **Когда стоит использовать дообучение?**

1. **Настройка стиля и тона:**\
   Если ваш бизнес требует строго определённого стиля общения или формата ответов.
2. **Сложные задачи:**\
   Когда промптинг (создание запросов) не даёт надёжных результатов, а сценарии слишком сложны для стандартной модели.
3. **Улучшение качества:**\
   Для обработки большого количества специфических примеров, которые не умещаются в рамках одного запроса.
4. **Снижение затрат:**\
   Переход на менее дорогую модель (например, с GPT-4o на GPT-4o-mini) с сохранением качества за счёт дообучения.
5. **Автоматизация редких случаев:**\
   Для обработки узкоспециализированных запросов или сложных случаев, которые базовая модель часто не понимает.

***

### **Как работает процесс дообучения?**

1. **Сбор данных:**\
   Вы предоставляете набор данных, который включает примеры диалогов.
2. **Обучение:**\
   Модель дообучается на ваших данных, запоминая логику, структуру и стиль, характерные для вашего бизнеса.
3. **Тестирование и корректировка:**\
   Полученная модель тестируется на реальных задачах. При необходимости добавляются новые данные или корректируются исходные.

***

### **Преимущества дообучения**

1. **Высокая точность ответов:**\
   Модель лучше понимает ваш бизнес, что делает её ответы более релевантными и уверенными.
2. **Экономия токенов:**\
   Поскольку модель уже «знает» ваш контекст, запросы становятся короче. Это сокращает расходы на использование.
3. **Снижение времени ответа:**\
   За счёт оптимизации данных запросы обрабатываются быстрее, что улучшает пользовательский опыт.
4. **Снижение затрат:**\
   Возможность перейти на менее дорогую модель с дообучением вместо использования более мощной базовой модели.

***

### **Сколько стоит дообучение и использование модели?**

При использовании дообученной модели необходимо учитывать два ключевых аспекта стоимости:

1. **Стоимость обучения модели:**
   * Процесс дообучения модели оплачивается отдельно.
   * Цена зависит от объёма и сложности данных для обучения. Чем больше данных, тем больше времени и ресурсов потребуется для их обработки.
2. **Стоимость использования дообученной модели:**
   * После завершения обучения дообученная модель становится в 2 раза дороже в эксплуатации по сравнению с базовой моделью, на которой она основана.
   * Это связано с дополнительной мощностью, необходимой для обработки уникальных данных, добавленных в процессе обучения.

### **Пример: Настройка для бизнеса**

**Кейс: Техническая поддержка**

Компания продаёт оборудование, и клиенты часто задают сложные вопросы по его эксплуатации.\
**Действия:**

1. Собраны данные: частые вопросы, диалоги менеджеров, технические инструкции.
2. Модель дообучена, чтобы отвечать на вопросы с точной информацией из базы знаний.
3. Тестирование на примерах реальных запросов показало: точность ответов выросла на 85%

**Результат:**

* Уменьшение нагрузки на службу поддержки.
* Повышение удовлетворённости клиентов за счёт мгновенных точных ответов.

***

### **Советы перед началом дообучения**

1. **Начните с промптинг-техник:**\
   Перед дообучением попробуйте улучшить результаты с помощью продвинутого промптинга. Это быстрее и проще.
2. **Подготовьте качественные данные:**\
   Убедитесь, что данные для обучения структурированы и лишены ошибок — это ключ к хорошему результату.
3. **Тестируйте и итеративно улучшайте:**\
   После обучения всегда проверяйте модель на реальных задачах и добавляйте недостающие данные.

### Цены

**Стоимость дообучения делится на два этапа:**\
1\. **Оплата самого обучения:** размер вашего датасета в токенах(промпт + функции + сообщения) умножается на количество эпох обучения(количество эпох подбирается автоматически Open AI) и умножается на цену обучения(25$ за миллион токенов).\
2\. **Использование дообученой модели:** стоит дороже чем использование базовой модели.\
\- Модель 4o mini дороже в 2 раза\
\- Модель 4o дороже в 1.5 раза

### **Выбор модели для обучения**

Доступный список моделей для обучения постоянно расширяется. Выбирайте подходящую модель, исходя из ваших конкретных задач и потребностей.

<figure><img src="https://2593311972-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2Fef2EBU68XAlye1NtG8DF%2Fuploads%2FMX9G8t4mHCo6jweyCzmT%2Fimage.png?alt=media&#x26;token=65091796-9136-4890-9d40-1ed85ccacb7e" alt=""><figcaption></figcaption></figure>

***

### **Заключение**

Дообучение — это мощный инструмент для создания уникального ИИ-ассистента, который идеально впишется в ваш бизнес. Этот метод позволяет вам сократить расходы, повысить точность ответов и добиться непревзойдённого уровня персонализации. **Используйте дообучение, чтобы сделать ваш ИИ действительно вашим.**
