AI-гайд

Эту статью целиком написал Claude Opus 4.7 (ИИ). Это не перевод и не официальная документация — собственный обзор ИИ на основе публичных источников. Для критичных решений проверяй факты сам.

OpenAI API: выбор модели для чат-бота

Составил: Claude · 2026-04-23

У OpenAI одновременно в каталоге много моделей: GPT-5.x, GPT-4.1, GPT-4o, семейство o-моделей (o3, o4-mini), mini/nano версии. Официальный pricing-лист отвечает на «сколько стоит», но не отвечает на главный вопрос: «какую взять под мой сценарий». Это — та самая шпаргалка.

Семейства моделей

GPT-5.x — флагман

На момент написания основной флагман — GPT-5.4. Ориентир на сложные задачи, длинные рассуждения, качественную речь. Есть три размера:

GPT-5.4 — $2.50 / $15.00 за 1M токенов (вход / выход).
GPT-5.4 mini — $0.75 / $4.50 за 1M.
GPT-5.4 nano — $0.20 / $1.25 за 1M.

GPT-4.1 — длинный контекст

GPT-4.1 остаётся в каталоге ради очень длинного окна — до 1M токенов. На большинстве задач GPT-5.x сильнее, но если нужно подать целиком длинный документ — 4.1 может оказаться удобнее. GPT-4.1 nano — самая дешёвая модель каталога ($0.10 / $0.40).

o-модели — рассуждения

o3 — основная «думающая» модель. $2.00 за 1M входа. Сменила дорогую o1 ($15.00) с 87% снижением цены и лучшей производительностью.
o4-mini — самая бюджетная из «думающих»: $1.10 за 1M. Хороший выбор, когда нужно не просто отвечать, а планировать и рассуждать, и при этом не раздуть счёт.

GPT-4o — legacy

Фактически устаревающая. Осталась в каталоге, но на новых проектах выбирать её уже нет смысла.

Как выбирать под сценарий

Сценарий	Что брать	Почему
Лёгкий чат, короткие ответы	GPT-5.4 mini или nano	Дёшево, быстро, качество достаточное.
Личностный чат-бот, диалог с поддержкой	GPT-5.4 или mini	Лучше улавливает тон. Mini — если нужен баланс цены.
Задача с планированием, мульти-шаг	o3 или o4-mini	Думающие модели, держат состояние через несколько шагов.
Длинный документ на вход (сотни тыс. токенов)	GPT-4.1	Единственная модель с 1M-окном.
Массовая классификация (тысячи запросов)	GPT-5.4 nano или GPT-4.1 nano	Самая дешёвая стоимость за запрос.
Смешанный диалог + действия (tools)	GPT-5.4 mini, при нехватке — GPT-5.4	Tool use хорошо работает на 5.x, на mini уже надёжно.

Экономия

Два встроенных механизма OpenAI, которые позволяют резко сократить счёт:

Prompt caching. На GPT-5.4 и GPT-4.1 кеш уменьшает стоимость входа на 75–90%. Особенно выгодно при длинных system-промптах, которые не меняются между запросами.
Batch API. Скидка 50% на всех моделях. Работает асинхронно — ответ приходит в течение 24 часов. Подходит для оффлайн-обработки.

Практические правила большого пальца

Для MVP старт с GPT-5.4 mini. Не переплатите и не упретесь в качество.
Если видите, что модель «не вытягивает» сложные вопросы — поднимайте до GPT-5.4, но сначала проверьте, не помогает ли лучший промпт.
Если задача «думай пошагово, считай, планируй» — берите o3 или o4-mini вместо gpt-5.x.
nano-версии — только для простых точных задач (классификация, форматирование). На свободном тексте они заметно хуже.
Включайте prompt caching сразу — это экономит деньги без потери качества.

Где свериться

Актуальный список моделей и цен — в оригинальной документации:

← Claude на русском Следующая: Claude vs OpenAI →