Справочник моделей
GPT-5.4, GPT-5.5, Codex-5.3, GPT-5.4-mini, режимы Fast и Priority — коэффициенты стоимости, уровни reasoning effort, рекомендации по выбору.
Сводная таблица
| Модель | Назначение | Коэффициент стоимости | Контекст |
|---|---|---|---|
gpt-5.4 | Базовая GPT-5, балансная | 1.0× | 256k |
gpt-5.5 | Расширенная, лучше для длинных задач | 1.4× | 400k |
gpt-5.4-mini | Дешёвая, быстрая, для классификаций | 0.2× | 128k |
codex-5.3 | Код-специализированная для Codex CLI | 1.1× | 256k |
Коэффициент применяется к базовой цене токенов OpenAI и умножается на маржу 1.09.
GPT-5.4
Универсальная модель по умолчанию. Подходит для чатов, генерации текста, простых рассуждений. Выбирайте её, если не уверены — она оптимальна по соотношению цены и качества.
{"model": "gpt-5.4", "messages": [...]}
GPT-5.5
Расширенная версия с большим контекстом и более глубоким reasoning. Используйте для:
- длинных документов (>100k токенов),
- сложного анализа кода,
- многошаговых рассуждений,
- математики и логических задач.
Цена выше на 40%, но качество стоит того, когда gpt-5.4 не справляется.
GPT-5.4-mini
Самая дешёвая модель. Подходит для:
- классификации, разметки, тегирования,
- извлечения структурированных данных из текста,
- простых fallback-сценариев,
- генерации embedding-альтернатив.
Не используйте её для генерации длинного текста или кода — качество ниже.
Codex-5.3
Специализированная под Codex CLI и задачи генерации кода. Поддерживает Responses API (POST /v1/responses) для интерактивных агентских сессий. Выбирайте для:
- автодополнения кода в IDE,
- генерации патчей и diff,
- агентских циклов с tool use.
codex --model codex-5.3 "Сгенерируй REST API на FastAPI"
Режимы: Fast и Priority
При запросе можно указать режим обработки через параметр service_tier:
default(по умолчанию) — стандартная очередь.priority— выше приоритет, меньше задержка, цена +30%.flex— пакетная обработка, цена −40%, ожидание до нескольких минут.
{"model": "gpt-5.4", "service_tier": "priority", "messages": [...]}
Reasoning effort
Для моделей GPT-5.x доступен параметр reasoning_effort (управляет глубиной внутренних рассуждений):
| Значение | Множитель к выходным токенам | Когда использовать |
|---|---|---|
minimal | 1.0× | Простые ответы, чаты, классификации |
low | 1.5× | Базовое рассуждение, типичные задачи |
medium | 2.5× | Сложный анализ, многошаговая логика |
high | 4.0× | Математика, проверка доказательств, дебаг |
{
"model": "gpt-5.4",
"reasoning_effort": "medium",
"messages": [{"role": "user", "content": "Реши уравнение..."}]
}
Чем выше effort, тем больше внутренних reasoning-токенов модель тратит — и тем дороже запрос. Начинайте с minimal и повышайте, если качество ответа недостаточно.
Как выбрать
- Чат-бот / агент общего назначения →
gpt-5.4+minimal. - Анализ длинного PDF / большого репозитория →
gpt-5.5+medium. - Codex CLI / IDE-помощник →
codex-5.3. - Массовая классификация →
gpt-5.4-mini+minimal. - Реальный production-агент с tool use →
codex-5.3+low/medium.
Подробнее о расчёте стоимости — в разделе Биллинг.