[アップデート] Kiro CLI 2.4 で会話の巻き戻し(Rewind)とエフォート制御が追加されたので使ってみた

[アップデート] Kiro CLI 2.4 で会話の巻き戻し(Rewind)とエフォート制御が追加されたので使ってみた

2026.05.21

いわさです。

これまで Kiro CLI でエージェントとの会話が意図しない方向に進んでしまった場合、最初からやり直すか、手動で修正を加える必要がありました。
また、思考の深さはモデルのデフォルトに任せるしかなく、簡単な質問でも複雑な問題でも同じレベルの推論が行われていました。

先日 Kiro CLI 2.4.0 がリリースされ、会話の巻き戻し(/rewind)とエフォート制御(/effort)が追加されました。

https://kiro.dev/changelog/cli/2-4/

/effort はモデルの思考の深さを 5 段階(low / medium / high / xhigh / max)で制御できる機能です。
low にすると高速で簡潔なレスポンスが得られ、max にすると複雑な問題に対してより深い分析が行われるようになるとのこと。

Lower effort levels produce faster, shorter responses. Higher levels spend more tokens on deeper analysis, multi-step reasoning, and thorough code generation.

https://kiro.dev/docs/cli/chat/effort/

/rewind は会話の任意のターンまで戻って、そこから別の方向に分岐できる機能です。
元のセッションはそのまま保持されるので、元の会話を失うことなく別のアプローチを試すことが出来ます。

https://kiro.dev/docs/cli/chat/rewind/

その他にも /settings コマンドによる統合設定メニューや、モデルごとのデフォルト設定(chat.modelDefaults)も追加されているようです。

Workspace initialization is also 88% faster.

また、ワークスペースの初期化が 88% 高速化されたとのこと。

今回は /effort/rewind を中心に確認してみたので紹介します。

アップデートして確認してみる

まず Kiro CLI を 2.4.0 にアップデートします。

% curl -fsSL https://cli.kiro.dev/install | bash
Kiro CLI installer:

Detected existing Amazon Q CLI installation
Kiro CLI is the new version of Amazon Q CLI. Updating to latest version.

Warning! Q CLI is now Kiro CLI and should be invoked as kiro-cli rather than q
█████████████████████████████████████████████████████████████████████████████████████████████████ 100/100

🎉 Installation complete! Happy coding!

Next steps:
Use the command "kiro-cli" to get started!

% kiro-cli --version                            
kiro-cli 2.4.0

Changelog から新しいスラッシュコマンドが確認できますね。

484C0CE1-7AEB-4DE6-86F3-871DEB8E0A1B.png

/effort でエフォートを制御する

まず auto モデルのまま /effort を実行してみたところ、以下のメッセージが表示されました。

BC1B8159-F740-4D6D-8D23-EF4BA2A4D642.png

auto モードではエフォート設定が使えず、claude-opus-4.7 のようにエフォートをサポートするモデルを /model で選択する必要があるみたいです。

本日時点で確認したところ、エフォート設定に対応しているモデルは以下の 3 つでした。

  • claude-opus-4.7
  • claude-opus-4.6
  • claude-sonnet-4.6

また、claude-sonnet-4.6 では 5 段階すべてが使えるわけではなく、Low / Medium / High / Max の 4 段階のみ表示されました(xHigh がない)。
モデルによって利用可能なレベルが異なるみたいです。

D5F0C414-3063-4CD6-80B5-879196FF9C4C_4_5005_c.jpeg

/model で claude-opus-4.7 に切り替えたところ、ステータスバーに Kiro · claude-opus-4.7 · xHigh · ⊙ 5% と表示されました。
claude-opus-4.7 のビルトインデフォルトは xHigh ってことか。

A4EE97DD-B59C-4711-9E9C-1E19F4125F84_4_5005_c.jpeg

この状態で /effort を実行すると、5 段階のレベル選択ピッカーが表示されます。
現在のレベルには [active] マークが付いています。

B4630813-BF37-4A44-A78F-C7E2D0F4D350_4_5005_c.jpeg

公式ドキュメントによると、各レベルは以下のような用途を想定しているみたいです。

レベル 用途
Low 簡単な質問やクイックな検索向け。高速で簡潔なレスポンス
Medium バランスの取れた推論。一般的な開発タスクに適している
High 複雑なリファクタリングやアーキテクチャの判断に向いている
xHigh 複数ファイルの変更やニュアンスのある問題に有用
Max 難しいデバッグ、セキュリティ分析、複雑なロジックに最適

なお、すべてのモデルがすべてのレベルに対応しているわけではなく、ピッカーには現在のモデルで利用可能なレベルのみが表示されるとのこと。

Low を選択すると Effort set to low と表示され、ステータスバーも Low に変わりました。

8E419B9D-7AC2-44B5-8F62-E3F15E20E044_4_5005_c.jpeg

エフォートレベルによるクレジット消費の違い

公式ドキュメントには以下のように記載されています。

Lower effort levels produce faster, shorter responses. Higher levels spend more tokens on deeper analysis, multi-step reasoning, and thorough code generation.

エフォートが高いほどトークン消費が多くなるとのことなので、実際に Low と Max で同じ質問をしてクレジット消費量を比較してみました。

まずシンプルな質問「AWSのリージョンを3つ教えて」で試したところ、どちらも Credits: 0.17 で差が出ませんでした。
質問がシンプルすぎると、Max でも推論を深める余地がないようです。(あるいは2回目の質問はコンテキスト引きづられている可能性があるが...)

43BA6515-5E25-48E6-8698-5C4D467290CF_4_5005_c.jpeg

7B649E31-A0BC-41ED-88D6-C50765542A8E_4_5005_c.jpeg

次に「S3バケットのセキュリティベストプラクティスを網羅的に説明して」という複雑な質問で試してみました。

Low では Web 検索などのツール呼び出しを行わず、いきなり回答を出力し始めました。

020B6FF5-9B0B-4671-9ECF-5919C033DECA.png

一方 Max では search_documentationread_documentation と公式ドキュメントを検索・参照してから回答を生成していました。

7FC79145-DCA3-4D16-91F3-1781B154574D_4_5005_c.jpeg

1F55EDC1-08AA-4713-B4BD-225DDE9E4EDF.png

結果をまとめると以下の通りです。

Credits Time ツール呼び出し
Low 0.60 25s なし
Max 2.62 1m 35s search_documentation, read_documentation

Max はクレジット消費が約 4.4 倍、時間も約 4 倍かかりましたが、公式ドキュメントを参照した上で情報量の多い回答が得られました。
エフォートレベルによって単に回答の長さが変わるだけでなく、ツール呼び出しとか探索のアプローチまで変わってますね。

モデルごとのデフォルトエフォート設定

公式ドキュメントによると、cli.json にモデルごとのデフォルトエフォートを設定しておくことで、毎回 /effort を実行しなくても済むようです。

.kiro/settings/cli.json
{
  "chat": {
    "modelDefaults": {
      "claude-opus-4.7": {
        "output_config": {
          "effort": "low"
        }
      }
    }
  }
}

エフォートレベルの優先順位は以下の通りとのこと。

  1. セッション中に /effort で設定した値
  2. ワークスペースの .kiro/settings/cli.jsonchat.modelDefaults
  3. ユーザーの ~/.kiro/settings/cli.jsonchat.modelDefaults
  4. モデルのビルトインデフォルト

When determining the effort level for a session, Kiro applies this priority order:

  1. Session override — value set via /effort during the current session
  2. Workspace defaults — chat.modelDefaults in .kiro/settings/cli.json
  3. User defaults — chat.modelDefaults in ~/.kiro/settings/cli.json
  4. Built-in defaults — the model's standard effort level

ただし、今回ワークスペースの .kiro/settings/cli.json に上記の設定を書いて試してみたところ、新しいセッションを開始してもビルトインデフォルトの xHigh のままでした。
ドキュメント通りであれば反映されるはずなのですが、私の環境ではうまく動かなかったです。
うまく動いた方がいたら教えてください。

/rewind で会話を巻き戻す

ここまでの effort の比較検証で気づいたのですが、同じセッション内で同じ質問を Low と Max で連続して試すと、2回目の回答が1回目の内容を考慮した Thinking を始めてしまいました。
セッション内のコンテキストに前の回答が残っているので、純粋な比較にならないんですよね。

DA8FFBAF-F95C-47AC-A8A7-9938A423F051_4_5005_c.jpeg

まさにこういう時に /rewind が使えます。

会話の任意のターンまで戻って、そこから別の方向に分岐できるので、前の回答に引きずられないクリーンな状態から再試行できます。
冒頭で紹介した通り、同じターンから異なる指示を出して結果を比較する、いわゆるプロンプトの A/B テスト的な使い方ですね。

では実際に試してみます。
いくつかの会話を行った後に /rewind を実行してみました。

32FE3DAD-1EA3-4C08-9178-9A535BBBB2DB.png

「Fork from a previous prompt in this session」というタイトルでインタラクティブなピッカーが表示されました。
各ターンのユーザープロンプトと、その時点でのコンテキスト使用率(Context used)が一覧で確認できます。
検索フィルターも付いているので、ターン数が多くなっても目的のプロンプトを探しやすそうですね。

巻き戻し先のターンを選択して Enter を押すと、そこから新しいセッションが作成されます。

0C4F2E52-FB3F-42B4-B3EA-C31CCCAB5B0B_4_5005_c.jpeg

Loaded session と表示され、選択したターンの時点から新しいセッションとして分岐していることがわかります。
元のセッションは変更されないので、/chat resume で元のセッションに戻ることも出来ます。

なお、公式ドキュメントによると巻き戻しはあくまで会話の分岐であり、ディスク上のファイル変更は巻き戻されないみたいです。
ファイルの変更を元に戻したい場合は Git などのバージョン管理を使う必要があるとのこと。

Rewinding creates a new conversation branch — it does not undo file changes made in later turns. Your files on disk remain as they are. If you need to revert file changes, use your version control system.

https://kiro.dev/docs/cli/chat/rewind/

さいごに

本日は Kiro CLI 2.4 にエフォート制御(/effort)と会話の巻き戻し(/rewind)が追加されたので確認してみました。

/effort はタスクの複雑さに応じて思考の深さを調整できるので、簡単な質問には素早く、複雑な問題にはじっくり考えさせる、という使い分けが出来るようになりました。
実際に Low と Max で比較したところ、クレジット消費やツール呼び出しの積極性に明確な差が出たので、コスト意識しながら使い分けるのが良さそうです。

/rewind は同じセッション内でコンテキスト汚染されてしまった時に、クリーンな状態から再試行できるので、地味に使い所多そうです。

この記事をシェアする

AWSのお困り事はクラスメソッドへ

関連記事