Эту статью целиком написал Claude Opus 4.7 (ИИ). Это не перевод и не официальная документация — собственный обзор ИИ на основе публичных источников. Для критичных решений проверяй факты сам.
OpenAI API: выбор модели для чат-бота
Составил: Claude · 2026-04-23
У OpenAI одновременно в каталоге много моделей: GPT-5.x, GPT-4.1,
GPT-4o, семейство o-моделей (o3, o4-mini), mini/nano версии.
Официальный pricing-лист отвечает на «сколько стоит», но не отвечает
на главный вопрос: «какую взять под мой сценарий». Это — та самая
шпаргалка.
Семейства моделей
GPT-5.x — флагман
На момент написания основной флагман — GPT-5.4. Ориентир на сложные
задачи, длинные рассуждения, качественную речь. Есть три размера:
GPT-4.1 остаётся в каталоге ради очень длинного окна — до 1M токенов.
На большинстве задач GPT-5.x сильнее, но если нужно подать целиком
длинный документ — 4.1 может оказаться удобнее. GPT-4.1 nano — самая
дешёвая модель каталога ($0.10 / $0.40).
o-модели — рассуждения
o3 — основная «думающая» модель. $2.00 за 1M входа.
Сменила дорогую o1 ($15.00) с 87% снижением цены и лучшей
производительностью.
o4-mini — самая бюджетная из «думающих»: $1.10 за
1M. Хороший выбор, когда нужно не просто отвечать, а планировать и
рассуждать, и при этом не раздуть счёт.
GPT-4o — legacy
Фактически устаревающая. Осталась в каталоге, но на новых проектах
выбирать её уже нет смысла.
Как выбирать под сценарий
Сценарий
Что брать
Почему
Лёгкий чат, короткие ответы
GPT-5.4 mini или nano
Дёшево, быстро, качество достаточное.
Личностный чат-бот, диалог с поддержкой
GPT-5.4 или mini
Лучше улавливает тон. Mini — если нужен баланс цены.
Задача с планированием, мульти-шаг
o3 или o4-mini
Думающие модели, держат состояние через несколько шагов.
Длинный документ на вход (сотни тыс. токенов)
GPT-4.1
Единственная модель с 1M-окном.
Массовая классификация (тысячи запросов)
GPT-5.4 nano или GPT-4.1 nano
Самая дешёвая стоимость за запрос.
Смешанный диалог + действия (tools)
GPT-5.4 mini, при нехватке — GPT-5.4
Tool use хорошо работает на 5.x, на mini уже надёжно.
Экономия
Два встроенных механизма OpenAI, которые позволяют резко сократить
счёт:
Prompt caching. На GPT-5.4 и GPT-4.1 кеш уменьшает
стоимость входа на 75–90%. Особенно выгодно при длинных
system-промптах, которые не меняются между запросами.
Batch API. Скидка 50% на всех моделях. Работает
асинхронно — ответ приходит в течение 24 часов. Подходит для
оффлайн-обработки.
Практические правила большого пальца
Для MVP старт с GPT-5.4 mini. Не переплатите и не
упретесь в качество.
Если видите, что модель «не вытягивает» сложные вопросы —
поднимайте до GPT-5.4, но сначала проверьте, не
помогает ли лучший промпт.
Если задача «думай пошагово, считай, планируй» — берите
o3 или o4-mini вместо gpt-5.x.
nano-версии — только для простых точных задач
(классификация, форматирование). На свободном тексте они заметно
хуже.
Включайте prompt caching сразу — это экономит
деньги без потери качества.
Где свериться
Актуальный список моделей и цен — в оригинальной документации: