Claude Code で Fable 5 が会話の途中で Opus 4.8 へ切り替わる挙動を再現してみる

Claude Code で Fable 5 が会話の途中で Opus 4.8 へ切り替わる挙動を再現してみる

2026.06.10

はじめに

データ事業本部の荒木です。

2026年6月9日にリリースされた新モデルClaude Fable 5について、Fable 5の概要を押さえたうえで、私が特に気になった「会話の途中でモデルが切り替わった理由」というヘルプ記事です。
Fable 5には、特定のトピックを検知すると会話の途中で勝手にClaude Opus 4.8へ降りるという挙動があるようなのでそちらを確かめてみたいと思います。

本題

Claude Fable 5とは

Claude Fable 5は、AnthropicがMythos級と呼ぶ、Opusより上に位置づけられた新しいティアのモデルを、一般利用向けに安全化したものです。同じ基盤モデルからセーフガードを外した無制限版はClaude Mythos 5という名前で、こちらはサイバーセキュリティのパートナーや生物研究者など、審査を通った一部の利用者にのみ提供されます。私たちが普通に使えるのはFable 5の方です。

名前についても公式が少し触れていて、個人的に気になったので拾っておきます。Fableはラテン語のfabula(「語られるもの」)に由来し、ギリシャ語のmythosと同根とのことです。同じ基盤モデルでありながらFableとMythosで名前を分けているのは、セーフガードの有無で区別するためだと説明されています。

料金は公式ページの情報は以下になります。

1e65982497d7d4891219ed0e83141625a291b860-2600x2870

上位ティアらしく、これまでの主力モデルより高めの価格設定です。提供形態としては、6月22日までPro/Max/Team/Enterpriseの各プランに無料で付属し、それ以降は利用クレジットの購入が必要になります。

安全面もかなり手厚く作られています。公式によると、外部のバグバウンティでは1,000時間以上のテストでも汎用的なジェイルブレークは見つからず、400ターンの攻撃的サイバーセキュリティ評価を行っているとのことです。データの扱いも、Mythos級モデルでは全トラフィックに30日間の保持を課したうえで、学習を含む安全性以外の用途には使わず、人間によるアクセスはすべてログ記録すると説明されています。能力の高さだけでなく、安全側の仕組みを厚く積んだうえでの一般公開という位置づけです。

仕組みのおさらい: 勝手にOpus 4.8へ降りる

挙動を観察する前に、仕組みを整理しておきます。

  • Fable 5は誤用検知の分類器を内蔵していて、サイバーセキュリティ・生物/化学・蒸留攻撃に該当するリクエストを受け取ると、応答せず同じ会話のままClaude Opus 4.8に処理を引き渡す
  • この切替が起きるのは平均で全セッションの5%未満
  • 切替はClaude Code含む各製品でデフォルト有効。オン/オフのトグルもあるが、その効きは後述する

つまり普通に使っているとほぼ遭遇しない挙動です。だからこそ、起きる条件を自分で作って観察してみます。

会話の途中でOpus 4.8に切り替わる瞬間を見る

本題です。セーフガード対象に触れるリクエストを送ると、Claudeはそれを同じ会話のままOpus 4.8で実行し直し、画面にモデルが切り替わった通知が出ます。応答には「どのモデルが答えたか」のラベルも付きます。

今回はあくまで悪用ではない用途の範囲で、防御寄りのセキュリティの質問を投げてみました。攻撃のためではない正当な質問でも分類器が反応するのか、という観点での確認です。

まずはモデルをFableに切り替えます。

スクリーンショット 2026-06-10 165440

その後、セーフガードに触れるような質問を投げてみます。

スクリーンショット 2026-06-10 165402

最初はFableのまま処理されていますが、途中でOpusに切り替わったことが確認できました。

スクリーンショット 2026-06-10 16544011

スクリーンショット 2026-06-10 165541

切替が起きたあと、モデルピッカーからFable 5に戻しても、元のリクエストがまだ会話に残っているため、何も変えずに続けると同じ判定で再びブロックされることがあります。戻すときは原因になったやり取りを会話から外すか、話題を変える必要がありました。

切替をオフにするとClaude Codeでは一時停止する

この切替を止められないか、設定もいじってみました。最初に試したのはClaude Codeの設定ファイル(~/.claude/settings.json)にあるswitchModelsOnFlagというキーですが、これをオン/オフしても挙動は変わりませんでした。

実際に効いたのは、公式に書いてある通りのWeb版(またはデスクトップアプリ)側の設定でした。Web側で自動モデル切替をオフにすると、その設定はClaude Codeにも同期します。

以下から設定変更できます。

スクリーンショット 2026-06-10 181304

オフにした状態で同じSSRFの質問をClaude Codeで投げると、Opus 4.8へ自動で切り替わる代わりに、回答が途中で止まり、次のように選択肢が示されました。

スクリーンショット 2026-06-10 190100

つまり自動切替をオンにしておくとフラグ時に自動でOpus 4.8へ降り、オフにしておくとここで止まって「Opus 4.8に切り替える」か「プロンプトを直してFable 5で再試行する」かを自分で選ぶ、という違いでした。設定はClaude Code側ではなくWeb/デスクトップ側にあり、それがClaude Codeにも効いてくる、というのが分かりにくい点でした。

なお、この一時停止メッセージ自体がThey may flag safe, normal content as well(安全で普通の内容もフラグすることがある)と認めています。今回投げたのはSSRFの防御策をたずねる正当な質問でしたが、それでもこうしてフラグされました。攻撃のための質問でなくても、サイバーセキュリティや生物系の話題に触れると引っかかり得る、というのは実際に触ってみて分かった感触です。

ちなみにWeb版(またはデスクトップアプリ)側は以下のように停止されました。

スクリーンショット 2026-06-10 181412

まとめ

Claude Codeに来た新モデルClaude Fable 5について、普段の作業ではほとんど遭遇しないとは思いますが、「会話の途中で勝手にOpus 4.8へ降りる」という挙動を実際に発生させて確認してみました。

悪用を防ぐためのセーフガードではありますが、セーフガードに抵触するような質問を意図的にするようなことは止めておきましょう。

参照


Claudeならクラスメソッドにお任せください

クラスメソッドは、Anthropic社とリセラー契約を締結しています。各種製品ガイドから、業種別の活用法、フェーズごとのお悩み解決などサービス支援ページにまとめております。まずはご覧いただき、お気軽にご相談ください。

サービス詳細を見る

この記事をシェアする

関連記事