MODELS

Справочник моделей

GPT-5.4, GPT-5.5, Codex-5.3, GPT-5.4-mini, режимы Fast и Priority — коэффициенты стоимости, уровни reasoning effort, рекомендации по выбору.

19 мая 2026 г.

Сводная таблица

Модель	Назначение	Коэффициент стоимости	Контекст
`gpt-5.4`	Базовая GPT-5, балансная	1.0×	256k
`gpt-5.5`	Расширенная, лучше для длинных задач	1.4×	400k
`gpt-5.4-mini`	Дешёвая, быстрая, для классификаций	0.2×	128k
`codex-5.3`	Код-специализированная для Codex CLI	1.1×	256k

Коэффициент применяется к базовой цене токенов OpenAI и умножается на маржу 1.09.

GPT-5.4

Универсальная модель по умолчанию. Подходит для чатов, генерации текста, простых рассуждений. Выбирайте её, если не уверены — она оптимальна по соотношению цены и качества.

{"model": "gpt-5.4", "messages": [...]}

GPT-5.5

Расширенная версия с большим контекстом и более глубоким reasoning. Используйте для:

длинных документов (>100k токенов),
сложного анализа кода,
многошаговых рассуждений,
математики и логических задач.

Цена выше на 40%, но качество стоит того, когда gpt-5.4 не справляется.

GPT-5.4-mini

Самая дешёвая модель. Подходит для:

классификации, разметки, тегирования,
извлечения структурированных данных из текста,
простых fallback-сценариев,
генерации embedding-альтернатив.

Не используйте её для генерации длинного текста или кода — качество ниже.

Codex-5.3

Специализированная под Codex CLI и задачи генерации кода. Поддерживает Responses API (POST /v1/responses) для интерактивных агентских сессий. Выбирайте для:

автодополнения кода в IDE,
генерации патчей и diff,
агентских циклов с tool use.

codex --model codex-5.3 "Сгенерируй REST API на FastAPI"

Режимы: Fast и Priority

При запросе можно указать режим обработки через параметр service_tier:

default (по умолчанию) — стандартная очередь.
priority — выше приоритет, меньше задержка, цена +30%.
flex — пакетная обработка, цена −40%, ожидание до нескольких минут.

{"model": "gpt-5.4", "service_tier": "priority", "messages": [...]}

Reasoning effort

Для моделей GPT-5.x доступен параметр reasoning_effort (управляет глубиной внутренних рассуждений):

Значение	Множитель к выходным токенам	Когда использовать
`minimal`	1.0×	Простые ответы, чаты, классификации
`low`	1.5×	Базовое рассуждение, типичные задачи
`medium`	2.5×	Сложный анализ, многошаговая логика
`high`	4.0×	Математика, проверка доказательств, дебаг

{
  "model": "gpt-5.4",
  "reasoning_effort": "medium",
  "messages": [{"role": "user", "content": "Реши уравнение..."}]
}

Чем выше effort, тем больше внутренних reasoning-токенов модель тратит — и тем дороже запрос. Начинайте с minimal и повышайте, если качество ответа недостаточно.

Как выбрать

Чат-бот / агент общего назначения → gpt-5.4 + minimal.
Анализ длинного PDF / большого репозитория → gpt-5.5 + medium.
Codex CLI / IDE-помощник → codex-5.3.
Массовая классификация → gpt-5.4-mini + minimal.
Реальный production-агент с tool use → codex-5.3 + low/medium.

Подробнее о расчёте стоимости — в разделе Биллинг.