У Anthropic не одна «модель Claude», а семейство. Внутри семейства модели отличаются скоростью, ценой, размером памяти и тем, умеют ли они «думать вслух» перед ответом. Когда вы работаете в Claude Code Desktop над системой управления производством, вы каждый день делаете выбор: какую модель взять, какой «уровень усилия» задать. Эта статья объясняет, что именно вы выбираете и зачем.
Сейчас актуальны три модели поколения 4.x. У каждой своя ниша.
| Модель | Контекст (вход) | Max output | Thinking | Knowledge cutoff |
|---|---|---|---|---|
| Claude Opus 4.7 | 1 000 000 токенов | 128K | только Adaptive | январь 2026 |
| Claude Sonnet 4.6 | 1 000 000 токенов | 64K | Adaptive + Extended | август 2025 |
| Claude Haiku 4.5 | 200 000 токенов | 64K | только Extended | февраль 2025 |
Дальше — что значит каждая колонка.
Контекстное окно — это сколько модель может «удержать в голове» за один разговор: ваши сообщения, её ответы, файлы, которые Claude Code прочитал. Измеряется в токенах (приблизительно: один токен ≈ полслова русского текста).
1 000 000 токенов у Opus и Sonnet — это примерно средняя книга или весь исходный код небольшого Ktor-проекта вместе с миграциями Postgres и React-фронтендом. 200 000 токенов у Haiku — поменьше, но всё ещё хватает на десятки файлов.
Max output — сколько токенов модель может выдать за один ответ. 128K у Opus — это много: длинная архитектурная записка, целый модуль кода. 64K у Sonnet и Haiku — тоже немало, одного ответа хватает на несколько файлов сразу.
Knowledge cutoff (буквально «обрыв знаний») — дата, после которой модель не видела новых данных при обучении. У Opus 4.7 — январь 2026, у Sonnet 4.6 — август 2025, у Haiku 4.5 — февраль 2025.
Что это значит на практике для вашей работы с Kotlin, Ktor, JDBI, Postgres и React:
build.gradle.kts, package.json и сам
исходный код — он видит, какие версии у вас стоят, и подстраивается.
Но если вы спрашиваете «как сейчас правильно делать X в Ktor» —
ответ может быть устаревшим.
«Thinking» — это когда модель тратит часть ответа не на текст для вас, а на внутренние рассуждения: разбирает задачу, проверяет варианты, ловит свои ошибки. Это заметно поднимает качество на сложных задачах, но делает ответ дороже и медленнее.
У Anthropic есть два режима thinking — это разные механики, не путайте.
Extended thinking (расширенное обдумывание) — отдельный режим, который вы включаете явно. Модель сначала пишет цепочку рассуждений во внутренний блок (в чате он виден как разворачиваемая «коробочка» — можно открыть и почитать, как она думала), и только потом выдаёт финальный ответ.
Поддерживают: Sonnet 4.6 и Haiku 4.5.
Adaptive thinking (адаптивное обдумывание) — модель сама на ходу решает, нужно ли «подумать дольше» над конкретным вопросом. Отдельной кнопки нет, отдельной разворачиваемой коробочки обычно тоже нет — всё происходит внутри обычного ответа.
Поддерживают: Opus 4.7 и Sonnet 4.6.
Sonnet 4.6 — единственная модель, у которой есть оба режима. Opus 4.7 делает только adaptive (но делает его сильно). Haiku 4.5 — только extended (быстро и дёшево, но если включить — заметно умнее).
Помимо выбора модели, в Claude Code Desktop есть отдельный переключатель — уровень усилия (effort). Это «сколько модели стараться». На внутреннем уровне это управляет бюджетом токенов на thinking и общую агентскую работу.
Уровень усилия выбирается выпадающим списком в интерфейсе
Claude Code Desktop, рядом с выбором модели — внизу окна ввода.
Это не slash-команда: вы не пишете /effort high в
диалоге, вы выбираете значение мышкой и оно применяется ко всем
следующим сообщениям, пока вы его не поменяете.
Доступные значения зависят от модели:
low · medium ·
high · xhigh · max
low · medium ·
high
По умолчанию (если открыть API напрямую) уровень усилия —
high. Anthropic при этом рекомендует для кодинговых
задач ставить xhigh: на сложном коде разница заметная,
модель меньше «срезает углы». Но это рекомендация, не
дефолт — выбор остаётся за вами.
Грубый ориентир, когда что выбирать:
low / medium — простые точечные правки,
переименование, добавление поля в DTO, мелкая правка вёрстки.
Быстро и дёшево.
high — повседневная работа: новый эндпоинт со всем
обвесом, рефакторинг компонента React, миграция Postgres.
xhigh / max — сложные вещи: проектировать
схему БД, разбираться в гонке потоков, чинить нетривиальный баг,
где причина неочевидна.
Жёстких правил нет, но есть разумная стратегия по умолчанию:
Не относитесь к этому как к закону. Если Sonnet застрял на задаче — переключитесь на Opus и попросите его разобраться. Если Opus тратится на чепуху — переключитесь обратно. Переключение модели в Claude Code Desktop — две секунды, и история разговора при этом сохраняется.
Вы знаете, чем модели отличаются и как выбирать «уровень усилия». Дальше — как организовать работу в Claude Code так, чтобы не утонуть: план, маленькие шаги, тесты, ревью изменений. Это в следующей статье.