← Claude на русском
AI-гайд

Модели Claude и режимы thinking

AI-гайд · 2026-04-27

У Anthropic не одна «модель Claude», а семейство. Внутри семейства модели отличаются скоростью, ценой, размером памяти и тем, умеют ли они «думать вслух» перед ответом. Когда вы работаете в Claude Code Desktop над системой управления производством, вы каждый день делаете выбор: какую модель взять, какой «уровень усилия» задать. Эта статья объясняет, что именно вы выбираете и зачем.

Семейство 4.x — три модели

Сейчас актуальны три модели поколения 4.x. У каждой своя ниша.

Что в них отличается — таблица

Модель Контекст (вход) Max output Thinking Knowledge cutoff
Claude Opus 4.7 1 000 000 токенов 128K только Adaptive январь 2026
Claude Sonnet 4.6 1 000 000 токенов 64K Adaptive + Extended август 2025
Claude Haiku 4.5 200 000 токенов 64K только Extended февраль 2025

Дальше — что значит каждая колонка.

Контекстное окно и max output

Контекстное окно — это сколько модель может «удержать в голове» за один разговор: ваши сообщения, её ответы, файлы, которые Claude Code прочитал. Измеряется в токенах (приблизительно: один токен ≈ полслова русского текста).

1 000 000 токенов у Opus и Sonnet — это примерно средняя книга или весь исходный код небольшого Ktor-проекта вместе с миграциями Postgres и React-фронтендом. 200 000 токенов у Haiku — поменьше, но всё ещё хватает на десятки файлов.

Max output — сколько токенов модель может выдать за один ответ. 128K у Opus — это много: длинная архитектурная записка, целый модуль кода. 64K у Sonnet и Haiku — тоже немало, одного ответа хватает на несколько файлов сразу.

Knowledge cutoff — почему это важно

Knowledge cutoff (буквально «обрыв знаний») — дата, после которой модель не видела новых данных при обучении. У Opus 4.7 — январь 2026, у Sonnet 4.6 — август 2025, у Haiku 4.5 — февраль 2025.

Что это значит на практике для вашей работы с Kotlin, Ktor, JDBI, Postgres и React:

Adaptive vs Extended thinking

«Thinking» — это когда модель тратит часть ответа не на текст для вас, а на внутренние рассуждения: разбирает задачу, проверяет варианты, ловит свои ошибки. Это заметно поднимает качество на сложных задачах, но делает ответ дороже и медленнее.

У Anthropic есть два режима thinking — это разные механики, не путайте.

Extended thinking — «явная пауза перед ответом»

Extended thinking (расширенное обдумывание) — отдельный режим, который вы включаете явно. Модель сначала пишет цепочку рассуждений во внутренний блок (в чате он виден как разворачиваемая «коробочка» — можно открыть и почитать, как она думала), и только потом выдаёт финальный ответ.

Поддерживают: Sonnet 4.6 и Haiku 4.5.

Adaptive thinking — «модель сама решает»

Adaptive thinking (адаптивное обдумывание) — модель сама на ходу решает, нужно ли «подумать дольше» над конкретным вопросом. Отдельной кнопки нет, отдельной разворачиваемой коробочки обычно тоже нет — всё происходит внутри обычного ответа.

Поддерживают: Opus 4.7 и Sonnet 4.6.

Sonnet 4.6 — единственная модель, у которой есть оба режима. Opus 4.7 делает только adaptive (но делает его сильно). Haiku 4.5 — только extended (быстро и дёшево, но если включить — заметно умнее).

Уровень усилия в Claude Code Desktop

Помимо выбора модели, в Claude Code Desktop есть отдельный переключатель — уровень усилия (effort). Это «сколько модели стараться». На внутреннем уровне это управляет бюджетом токенов на thinking и общую агентскую работу.

Уровень усилия выбирается выпадающим списком в интерфейсе Claude Code Desktop, рядом с выбором модели — внизу окна ввода. Это не slash-команда: вы не пишете /effort high в диалоге, вы выбираете значение мышкой и оно применяется ко всем следующим сообщениям, пока вы его не поменяете.

Доступные значения зависят от модели:

По умолчанию (если открыть API напрямую) уровень усилия — high. Anthropic при этом рекомендует для кодинговых задач ставить xhigh: на сложном коде разница заметная, модель меньше «срезает углы». Но это рекомендация, не дефолт — выбор остаётся за вами.

Грубый ориентир, когда что выбирать:

Когда какая модель — практический совет

Жёстких правил нет, но есть разумная стратегия по умолчанию:

Не относитесь к этому как к закону. Если Sonnet застрял на задаче — переключитесь на Opus и попросите его разобраться. Если Opus тратится на чепуху — переключитесь обратно. Переключение модели в Claude Code Desktop — две секунды, и история разговора при этом сохраняется.

Что дальше

Вы знаете, чем модели отличаются и как выбирать «уровень усилия». Дальше — как организовать работу в Claude Code так, чтобы не утонуть: план, маленькие шаги, тесты, ревью изменений. Это в следующей статье.