Claude Fable 5: сильна, дорога, з зірочкою
Anthropic випустила найпотужнішу публічну модель — і одразу після власного попередження про небезпеку AI. Розбір без хайпу: що реально, що маркетинг, дві пастки інтеграції та як перевірити модель самому.
9-10 червня Anthropic випустила Claude Fable 5 — найпотужнішу публічну модель. За кілька днів до того вона ж попереджала, що AI стає надто небезпечним. Уже цей контраст вартий уваги. Розберімо без хайпу — і, головне, що це означає, коли ти реально інтегруєш її в продукт.
Коротко, що це
- Fable 5 (
claude-fable-5) — найпотужніша публічна модель Anthropic. Поруч Mythos 5 (claude-mythos-5) — те саме без запобіжників, лише обраним (Project Glasswing). - 1M контекст, до 128k вихід. $10/$50 за 1М (вихід ~вдвічі дорожчий за Opus 4.8).
- Adaptive thinking завжди ввімкнений; сирий chain-of-thought не віддається.
- Безкоштовно на Pro/Max/Team 9-22 червня.
«SOTA майже на всіх бенчмарках» — чия це цифра
Модель справді сильна — Simon Willison підтверджує незалежно. Але «майже на всіх» = не на всіх (де програє — не показують), а частина бенчмарків внутрішні чи клієнтські (Hex, IMC, Hebbia): продавець або покупець міряє сам себе. Незалежних відтворень на день релізу обмаль.
«Stripe мігрувала 50 млн рядків Ruby за день»
Найгучніша й найманіпулятивніша цифра. Насправді це одна codebase-wide міграція (один тип масової трансформації) у базі на 50М рядків, а не переписування мови. Клас задач, де codemod/AST працювали й ДО LLM. Плюс це «Stripe reported» у прес-релізі Anthropic — без інженерного посту самої Stripe. Хто рев'ював результат, скільки коштувало — тиша.
Платиш двічі: грошима і передбачуваністю
$10/$50, повільніше за Opus, легко спалити понад $100/день — Willison за добу інтенсиву спалив $110.42, більше за місячну підписку. Плюс mandatory 30-day retention (без zero-data-retention) — GitHub через це зробив Fable off-by-default для Business/Enterprise. Для пропрієтарного коду це комплаєнс-фактор, якого з Opus не було.
Пастка №1: відмови — штатна поведінка, не помилка
Класифікатори відмовляють у трьох доменах (кібербез, біо/хімія, дистиляція моделей) і віддають відповідь слабшою Opus 4.8. Ключове: відмова приходить як stop_reason: "refusal" — це HTTP 200, не помилка. Якщо твій код перевіряє лише HTTP-статус, він прийме «успішну» відповідь, яка насправді відмова.
const res = await client.messages.create({ model: "claude-fable-5", ... });
if (res.stop_reason === "refusal") {
// не помилка — модель відмовила. Перепитати на іншій моделі:
return await client.messages.create({ model: "claude-opus-4-8", ... });
}Anthropic дає три способи fallback: серверний параметр fallbacks, SDK-middleware або вручну. За відмову до генерації не білять, а fallback-кредит повертає вартість prompt-cache при перемиканні.
Пастка №2: невидима деградація
Окремо від видимого редіректу: ~0.03% запитів навколо frontier-AI-розробки тихо втрачають у якості — без refusal, без сигналу, без fallback. У платному продукті це означає неприємне: ти не завжди відрізниш межу самої моделі від прихованого втручання вендора. Це не теорія змови — це задокументована поведінка; просто про неї не пишуть у гучних заявах.
Security-інженерам — окремо й болісно
«Approved»-статус НЕ скасовує офенсив-фільтр. Легітимний пентест, vuln-research, аналіз малварі для захисту — усе це тригерить класифікатор і тихо даунгрейдить тебе на слабшу модель. The Register зафіксував відмови навіть на «Hello»; Anthropic визнала перестрогість і обіцяла зменшити false positives. А джейлбрейки вже публічні (Pliny обійшов класифікатори мульти-агентною декомпозицією і навіть витягнув системний промпт). Тобто бар'єр зупиняє ледачого, але штрафує чесного — асиметрія не на користь захисника.
Наратив «AI надто небезпечний» напередодні релізу
Не обов'язково лицемірство. Щира стурбованість і комерційний інтерес тут не суперечать — вони збігаються: «небезпечно, але ми єдині, хто вміє безпечно» = обґрунтування преміум-ціни й ексклюзивного Mythos для обраних. Safety стає і продуктом, і конкурентним ровом. Скепсис доречний не тому, що хтось бреше, а тому, що стимули вишикувані саме так.
Як перевірити самому (зміряй, не вір бенчмаркам)
- Cost/latency: прожени свій типовий агентний таск 20 разів, зміряй $/задачу і p95-латентність проти Opus 4.8.
- False-positive аудит: батч зі 100 легітимних security-промптів (читання CVE, аналіз малварі для захисту, конфіг fail2ban) → порахуй % тихого чи видимого даунгрейду.
- Міф міграції: візьми власний codemod-таск (типізація, перейменування API по репо) і порівняй Fable 5 vs детермінований AST-інструмент за коректністю й ціною — часто «без AI» виграє.
Коли воно реально варте
- Складні задачі, де якість дає вимірюваний виграш, а $50/1М окупається результатом.
- Великі контексти (1M), де простіша модель захлинається.
Коли НІ
- Рутина, де Opus 4.8 і так тягне.
- Security/offensive — фільтр зламає процес.
- Будь-що, де критична передбачуваність вартості й поведінки.
Практичний мінімум перед інтеграцією: обробка stop_reason: "refusal" + fallback, алерт на денний спенд, і не викидай Opus 4.8 зі стека — він тут і запасний план, і тиха заміна під капотом.
Джерела
- Anthropic — анонс Claude Fable 5 / Mythos 5
- Anthropic — Project Glasswing
- Simon Willison — перші враження
- TechCrunch — реліз після попередження про небезпеку
- The Register — відмови на безневинних промптах
- Latent.Space — silent RSI suppression, 30-day retention
- Hacker News — що саме мігрувала Stripe
Це мій досвід і погляд, не догма. Модель свіжа, незалежних відтворень бенчмарків поки мало — перевіряй актуальне під свою задачу. Факти станом на 11.06.2026.