Расходы на LLM
Last updated
Last updated
При каждом обращении к сервису языковых моделей (LLM), таких как OpenAI или другие аналогичные решения, стоимость рассчитывается за каждый отдельный запрос.
Стоимость одного запроса зависит от трех ключевых факторов:
Длины контекста — то есть вся информация, передаваемая нейросети: инструкции, старые сообщения, дополнительные данные и т.д.
Длины ответа от нейросети — чем длиннее результат, тем дороже запрос.
Выбранной модели — чем более сложная и умная модель, тем выше цена за её использование.
Длина контекста и ответа измеряется в токенах. Токен — это объём текста, который может обработать модель.
В среднем 1 слово на русском языке занимает 1-2 токена, так что 1 токен обычно соответствует около 3-4 символа текста.
Примеры:
Для оплаты запросов используется внутренняя валюта botcoin.
GPT-4.1 (Версия от 14.04.2025):
Входящие токены: 0.2 Botcoin/1000 токенов
Исходящие токены: 0.8 Botcoin/1000 токенов
GPT-4.1 Mini (Версия от 14.04.2025):
Входящие токены: 0.04 Botcoin/1000 токенов
Исходящие токены: 0.16 Botcoin/1000 токенов
GPT-4.1 Nano (Версия от 14.04.2025):
Входящие токены: 0.01 Botcoin/1000 токенов
Исходящие токены: 0.04 Botcoin/1000 токенов
GPT-4o (Версия от 20.11.2024):
Цена входящих токенов: 0.25 Botcoin/1000 токенов
Цена исходящих токенов: 1 Botcoin/1000 токенов
GPT-4o Mini (Версия от 18.07.2024):
Цена входящих токенов: 0.015 Botcoin/1000 токенов
Цена исходящих токенов: 0.06 Botcoin/1000 токенов
GPT-o3 (Версия от 16.04.2025):
Входящие токены: 1 Botcoin/1000 токенов
Исходящие токены: 4 Botcoin/1000 токенов