MODELS

Справочник моделей

GPT-5.4, GPT-5.5, Codex-5.3, GPT-5.4-mini, режимы Fast и Priority — коэффициенты стоимости, уровни reasoning effort, рекомендации по выбору.

Сводная таблица

МодельНазначениеКоэффициент стоимостиКонтекст
gpt-5.4Базовая GPT-5, балансная1.0×256k
gpt-5.5Расширенная, лучше для длинных задач1.4×400k
gpt-5.4-miniДешёвая, быстрая, для классификаций0.2×128k
codex-5.3Код-специализированная для Codex CLI1.1×256k

Коэффициент применяется к базовой цене токенов OpenAI и умножается на маржу 1.09.

GPT-5.4

Универсальная модель по умолчанию. Подходит для чатов, генерации текста, простых рассуждений. Выбирайте её, если не уверены — она оптимальна по соотношению цены и качества.

{"model": "gpt-5.4", "messages": [...]}

GPT-5.5

Расширенная версия с большим контекстом и более глубоким reasoning. Используйте для:

  • длинных документов (>100k токенов),
  • сложного анализа кода,
  • многошаговых рассуждений,
  • математики и логических задач.

Цена выше на 40%, но качество стоит того, когда gpt-5.4 не справляется.

GPT-5.4-mini

Самая дешёвая модель. Подходит для:

  • классификации, разметки, тегирования,
  • извлечения структурированных данных из текста,
  • простых fallback-сценариев,
  • генерации embedding-альтернатив.

Не используйте её для генерации длинного текста или кода — качество ниже.

Codex-5.3

Специализированная под Codex CLI и задачи генерации кода. Поддерживает Responses API (POST /v1/responses) для интерактивных агентских сессий. Выбирайте для:

  • автодополнения кода в IDE,
  • генерации патчей и diff,
  • агентских циклов с tool use.
codex --model codex-5.3 "Сгенерируй REST API на FastAPI"

Режимы: Fast и Priority

При запросе можно указать режим обработки через параметр service_tier:

  • default (по умолчанию) — стандартная очередь.
  • priority — выше приоритет, меньше задержка, цена +30%.
  • flex — пакетная обработка, цена −40%, ожидание до нескольких минут.
{"model": "gpt-5.4", "service_tier": "priority", "messages": [...]}

Reasoning effort

Для моделей GPT-5.x доступен параметр reasoning_effort (управляет глубиной внутренних рассуждений):

ЗначениеМножитель к выходным токенамКогда использовать
minimal1.0×Простые ответы, чаты, классификации
low1.5×Базовое рассуждение, типичные задачи
medium2.5×Сложный анализ, многошаговая логика
high4.0×Математика, проверка доказательств, дебаг
{
  "model": "gpt-5.4",
  "reasoning_effort": "medium",
  "messages": [{"role": "user", "content": "Реши уравнение..."}]
}

Чем выше effort, тем больше внутренних reasoning-токенов модель тратит — и тем дороже запрос. Начинайте с minimal и повышайте, если качество ответа недостаточно.

Как выбрать

  1. Чат-бот / агент общего назначенияgpt-5.4 + minimal.
  2. Анализ длинного PDF / большого репозиторияgpt-5.5 + medium.
  3. Codex CLI / IDE-помощникcodex-5.3.
  4. Массовая классификацияgpt-5.4-mini + minimal.
  5. Реальный production-агент с tool usecodex-5.3 + low/medium.

Подробнее о расчёте стоимости — в разделе Биллинг.