AI-гайд

Модели Claude и режимы thinking

AI-гайд · 2026-04-27

У Anthropic не одна «модель Claude», а семейство. Внутри семейства модели отличаются скоростью, ценой, размером памяти и тем, умеют ли они «думать вслух» перед ответом. Когда вы работаете в Claude Code Desktop над системой управления производством, вы каждый день делаете выбор: какую модель взять, какой «уровень усилия» задать. Эта статья объясняет, что именно вы выбираете и зачем.

Семейство 4.x — три модели

Сейчас актуальны три модели поколения 4.x. У каждой своя ниша.

Claude Opus 4.7 — самая мощная и самая дорогая. Хорошо тянет сложную архитектурную работу, длинные рассуждения, агентский кодинг (когда модель сама ходит по файлам, запускает тесты, исправляет ошибки).
Claude Sonnet 4.6 — рабочая лошадка. Заметно быстрее и дешевле Opus, но почти не уступает в качестве на типовых задачах. Большинство правок, рефакторингов, генерации CRUD-эндпоинтов и React-компонентов комфортно делать на Sonnet.
Claude Haiku 4.5 — самая быстрая и самая дешёвая. Подходит для коротких уточнений, классификаций, простых правок «найди-замени», подсказок по синтаксису.

Что в них отличается — таблица

Модель	Контекст (вход)	Max output	Thinking	Knowledge cutoff
Claude Opus 4.7	1 000 000 токенов	128K	только Adaptive	январь 2026
Claude Sonnet 4.6	1 000 000 токенов	64K	Adaptive + Extended	август 2025
Claude Haiku 4.5	200 000 токенов	64K	только Extended	февраль 2025

Дальше — что значит каждая колонка.

Контекстное окно и max output

Контекстное окно — это сколько модель может «удержать в голове» за один разговор: ваши сообщения, её ответы, файлы, которые Claude Code прочитал. Измеряется в токенах (приблизительно: один токен ≈ полслова русского текста).

1 000 000 токенов у Opus и Sonnet — это примерно средняя книга или весь исходный код небольшого Ktor-проекта вместе с миграциями Postgres и React-фронтендом. 200 000 токенов у Haiku — поменьше, но всё ещё хватает на десятки файлов.

Max output — сколько токенов модель может выдать за один ответ. 128K у Opus — это много: длинная архитектурная записка, целый модуль кода. 64K у Sonnet и Haiku — тоже немало, одного ответа хватает на несколько файлов сразу.

Knowledge cutoff — почему это важно

Knowledge cutoff (буквально «обрыв знаний») — дата, после которой модель не видела новых данных при обучении. У Opus 4.7 — январь 2026, у Sonnet 4.6 — август 2025, у Haiku 4.5 — февраль 2025.

Что это значит на практике для вашей работы с Kotlin, Ktor, JDBI, Postgres и React:

Если вышла новая версия библиотеки после cutoff модели — модель про неё не знает. Может уверенно сослаться на API, которого уже нет, или не знать про новые возможности.
Чем свежее cutoff — тем меньше риск. Opus 4.7 (январь 2026) знает почти все актуальные версии Ktor и React; Haiku 4.5 (февраль 2025) уже отстаёт примерно на год.
Claude Code это частично компенсирует тем, что читает build.gradle.kts, package.json и сам исходный код — он видит, какие версии у вас стоят, и подстраивается. Но если вы спрашиваете «как сейчас правильно делать X в Ktor» — ответ может быть устаревшим.
Для свежих библиотек или CVE используйте Claude Research или добавьте ссылку на актуальную документацию в промпт.

Adaptive vs Extended thinking

«Thinking» — это когда модель тратит часть ответа не на текст для вас, а на внутренние рассуждения: разбирает задачу, проверяет варианты, ловит свои ошибки. Это заметно поднимает качество на сложных задачах, но делает ответ дороже и медленнее.

У Anthropic есть два режима thinking — это разные механики, не путайте.

Extended thinking — «явная пауза перед ответом»

Extended thinking (расширенное обдумывание) — отдельный режим, который вы включаете явно. Модель сначала пишет цепочку рассуждений во внутренний блок (в чате он виден как разворачиваемая «коробочка» — можно открыть и почитать, как она думала), и только потом выдаёт финальный ответ.

Поддерживают: Sonnet 4.6 и Haiku 4.5.

Adaptive thinking — «модель сама решает»

Adaptive thinking (адаптивное обдумывание) — модель сама на ходу решает, нужно ли «подумать дольше» над конкретным вопросом. Отдельной кнопки нет, отдельной разворачиваемой коробочки обычно тоже нет — всё происходит внутри обычного ответа.

Поддерживают: Opus 4.7 и Sonnet 4.6.

Sonnet 4.6 — единственная модель, у которой есть оба режима. Opus 4.7 делает только adaptive (но делает его сильно). Haiku 4.5 — только extended (быстро и дёшево, но если включить — заметно умнее).

Уровень усилия в Claude Code Desktop

Помимо выбора модели, в Claude Code Desktop есть отдельный переключатель — уровень усилия (effort). Это «сколько модели стараться». На внутреннем уровне это управляет бюджетом токенов на thinking и общую агентскую работу.

Уровень усилия выбирается выпадающим списком в интерфейсе Claude Code Desktop, рядом с выбором модели — внизу окна ввода. Это не slash-команда: вы не пишете /effort high в диалоге, вы выбираете значение мышкой и оно применяется ко всем следующим сообщениям, пока вы его не поменяете.

Доступные значения зависят от модели:

Opus 4.7: low · medium · high · xhigh · max
Sonnet 4.6: low · medium · high

По умолчанию (если открыть API напрямую) уровень усилия — high. Anthropic при этом рекомендует для кодинговых задач ставить xhigh: на сложном коде разница заметная, модель меньше «срезает углы». Но это рекомендация, не дефолт — выбор остаётся за вами.

Грубый ориентир, когда что выбирать:

low / medium — простые точечные правки, переименование, добавление поля в DTO, мелкая правка вёрстки. Быстро и дёшево.
high — повседневная работа: новый эндпоинт со всем обвесом, рефакторинг компонента React, миграция Postgres.
xhigh / max — сложные вещи: проектировать схему БД, разбираться в гонке потоков, чинить нетривиальный баг, где причина неочевидна.

Когда какая модель — практический совет

Жёстких правил нет, но есть разумная стратегия по умолчанию:

Sonnet 4.6 как основной режим работы. 80–90% задач по производству лестниц — это CRUD: «добавь сущность «партия материала», свяжи её с заказом, сделай экран на React, положи в Postgres». Sonnet делает это быстро, дёшево и качественно. На нём же удобно гонять тесты в цикле.
Opus 4.7 — когда задача правда сложная. Спроектировать сразу несколько связанных таблиц с миграцией данных. Разобраться, почему транзакция в JDBI ведёт себя не так. Спланировать целый модуль с нуля. Здесь Opus экономит часы вашего времени, и его цена окупается.
Haiku 4.5 — для быстрых уточнений. «Как в Kotlin записать data-класс с дефолтным значением?», «короткий regex для номера телефона», «отформатируй этот JSON». Haiku отвечает мгновенно, и для таких вопросов большего и не нужно.

Не относитесь к этому как к закону. Если Sonnet застрял на задаче — переключитесь на Opus и попросите его разобраться. Если Opus тратится на чепуху — переключитесь обратно. Переключение модели в Claude Code Desktop — две секунды, и история разговора при этом сохраняется.

Что дальше

Вы знаете, чем модели отличаются и как выбирать «уровень усилия». Дальше — как организовать работу в Claude Code так, чтобы не утонуть: план, маленькие шаги, тесты, ревью изменений. Это в следующей статье.

← Как работают LLM Следующая: дисциплина с Claude Code →