Розбір

Claude Fable 5: сильна, дорога, з зірочкою

Anthropic випустила найпотужнішу публічну модель — і одразу після власного попередження про небезпеку AI. Розбір без хайпу: що реально, що маркетинг, дві пастки інтеграції та як перевірити модель самому.

Oleksandr Polianskyi

11.06.2026 — 3 хв читання3 min read

9-10 червня Anthropic випустила Claude Fable 5 — найпотужнішу публічну модель. За кілька днів до того вона ж попереджала, що AI стає надто небезпечним. Уже цей контраст вартий уваги. Розберімо без хайпу — і, головне, що це означає, коли ти реально інтегруєш її в продукт.

Коротко, що це

Fable 5 (claude-fable-5) — найпотужніша публічна модель Anthropic. Поруч Mythos 5 (claude-mythos-5) — те саме без запобіжників, лише обраним (Project Glasswing).
1M контекст, до 128k вихід. $10/$50 за 1М (вихід ~вдвічі дорожчий за Opus 4.8).
Adaptive thinking завжди ввімкнений; сирий chain-of-thought не віддається.
Безкоштовно на Pro/Max/Team 9-22 червня.

«SOTA майже на всіх бенчмарках» — чия це цифра

Модель справді сильна — Simon Willison підтверджує незалежно. Але «майже на всіх» = не на всіх (де програє — не показують), а частина бенчмарків внутрішні чи клієнтські (Hex, IMC, Hebbia): продавець або покупець міряє сам себе. Незалежних відтворень на день релізу обмаль.

«Stripe мігрувала 50 млн рядків Ruby за день»

Найгучніша й найманіпулятивніша цифра. Насправді це одна codebase-wide міграція (один тип масової трансформації) у базі на 50М рядків, а не переписування мови. Клас задач, де codemod/AST працювали й ДО LLM. Плюс це «Stripe reported» у прес-релізі Anthropic — без інженерного посту самої Stripe. Хто рев'ював результат, скільки коштувало — тиша.

Платиш двічі: грошима і передбачуваністю

$10/$50, повільніше за Opus, легко спалити понад $100/день — Willison за добу інтенсиву спалив $110.42, більше за місячну підписку. Плюс mandatory 30-day retention (без zero-data-retention) — GitHub через це зробив Fable off-by-default для Business/Enterprise. Для пропрієтарного коду це комплаєнс-фактор, якого з Opus не було.

Пастка №1: відмови — штатна поведінка, не помилка

Класифікатори відмовляють у трьох доменах (кібербез, біо/хімія, дистиляція моделей) і віддають відповідь слабшою Opus 4.8. Ключове: відмова приходить як stop_reason: "refusal" — це HTTP 200, не помилка. Якщо твій код перевіряє лише HTTP-статус, він прийме «успішну» відповідь, яка насправді відмова.

const res = await client.messages.create({ model: "claude-fable-5", ... });
if (res.stop_reason === "refusal") {
  // не помилка — модель відмовила. Перепитати на іншій моделі:
  return await client.messages.create({ model: "claude-opus-4-8", ... });
}

Anthropic дає три способи fallback: серверний параметр fallbacks, SDK-middleware або вручну. За відмову до генерації не білять, а fallback-кредит повертає вартість prompt-cache при перемиканні.

Пастка №2: невидима деградація

Окремо від видимого редіректу: ~0.03% запитів навколо frontier-AI-розробки тихо втрачають у якості — без refusal, без сигналу, без fallback. У платному продукті це означає неприємне: ти не завжди відрізниш межу самої моделі від прихованого втручання вендора. Це не теорія змови — це задокументована поведінка; просто про неї не пишуть у гучних заявах.

Security-інженерам — окремо й болісно

«Approved»-статус НЕ скасовує офенсив-фільтр. Легітимний пентест, vuln-research, аналіз малварі для захисту — усе це тригерить класифікатор і тихо даунгрейдить тебе на слабшу модель. The Register зафіксував відмови навіть на «Hello»; Anthropic визнала перестрогість і обіцяла зменшити false positives. А джейлбрейки вже публічні (Pliny обійшов класифікатори мульти-агентною декомпозицією і навіть витягнув системний промпт). Тобто бар'єр зупиняє ледачого, але штрафує чесного — асиметрія не на користь захисника.

Наратив «AI надто небезпечний» напередодні релізу

Не обов'язково лицемірство. Щира стурбованість і комерційний інтерес тут не суперечать — вони збігаються: «небезпечно, але ми єдині, хто вміє безпечно» = обґрунтування преміум-ціни й ексклюзивного Mythos для обраних. Safety стає і продуктом, і конкурентним ровом. Скепсис доречний не тому, що хтось бреше, а тому, що стимули вишикувані саме так.

Як перевірити самому (зміряй, не вір бенчмаркам)

Cost/latency: прожени свій типовий агентний таск 20 разів, зміряй $/задачу і p95-латентність проти Opus 4.8.
False-positive аудит: батч зі 100 легітимних security-промптів (читання CVE, аналіз малварі для захисту, конфіг fail2ban) → порахуй % тихого чи видимого даунгрейду.
Міф міграції: візьми власний codemod-таск (типізація, перейменування API по репо) і порівняй Fable 5 vs детермінований AST-інструмент за коректністю й ціною — часто «без AI» виграє.

Коли воно реально варте

Складні задачі, де якість дає вимірюваний виграш, а $50/1М окупається результатом.
Великі контексти (1M), де простіша модель захлинається.

Коли НІ

Рутина, де Opus 4.8 і так тягне.
Security/offensive — фільтр зламає процес.
Будь-що, де критична передбачуваність вартості й поведінки.

Практичний мінімум перед інтеграцією: обробка stop_reason: "refusal" + fallback, алерт на денний спенд, і не викидай Opus 4.8 зі стека — він тут і запасний план, і тиха заміна під капотом.

Джерела

Це мій досвід і погляд, не догма. Модель свіжа, незалежних відтворень бенчмарків поки мало — перевіряй актуальне під свою задачу. Факти станом на 11.06.2026.