Amazon Bedrockのアプリケーション推論プロファイルを作成〜削除までやってみた【Claude 4】

Amazon Bedrockのアプリケーション推論プロファイルを作成〜削除までやってみた【Claude 4】

Claude4をアプリケーション推論プロファイルで使い倒そう
Clock Icon2025.05.23

はじめに

生成AIアプリケーションやコーディングエージェントを使用する場合、モデルの使用状況やコストの可視化が重要な課題となっています。
特にコーディングエージェントでのモデル利用はコストが肥大化することが多々あり、適切にコスト管理する必要があります。
今回はアプリケーション推論プロファイルを使用して、ユーザー毎に専用プロファイルを作成してみます。

アプリケーション推論プロファイルとは

Amazon Bedrockには2種類の推論プロファイルがあり、その内アプリケーション推論プロファイルはユーザーで作成可能なものとなります。

クロスリージョン(システム定義)推論プロファイル – Amazon Bedrockで事前定義され、モデルへのリクエストをルーティングできる複数のリージョンを含む推論プロファイル。

アプリケーション推論プロファイル – コストとモデルの使用を追跡するためにユーザーが作成する推論プロファイル。モデル呼び出しリクエストを1つのリージョンまたは複数のリージョンにルーティングする推論プロファイルを作成できます。
1つのリージョンでモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルがリクエストをルーティングするリージョンで基盤モデルを指定します
複数のリージョンにわたるモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルがリクエストをルーティングするモデルとリージョンを定義するクロスリージョン(システム定義)推論プロファイルを指定します。

引用: 推論プロファイルを使用してモデル呼び出しリソースを設定する

やってみた

プロファイルの作成

まずはじめにプロファイルの作成から行います。
推論プロファイルはAmazon Bedrock APIを使用してのみ作成可能なためAWS CLIで作成します。
嬉しいことにBedrockでもClaude 4が使えるようになったので、今回はClaude Sonnet 4のクロスリージョン推論プロファイルをコピー元として設定します。

https://aws.amazon.com/jp/blogs/aws/claude-opus-4-anthropics-most-powerful-model-for-coding-is-now-in-amazon-bedrock/

terminal
aws bedrock create-inference-profile \
  --inference-profile-name <プロファイル名> \
  --model-source copyFrom=arn:aws:bedrock:a:ap-northeast-1:inference-profile/apac.anthropic.claude-sonnet-4-20250514-v1:0 \
  --tags key=<タグキー>,value=<タグ値> \
  --no-cli-pager
実行結果
{
    "inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/5czigg0hurg9",
    "status": "ACTIVE"
}

プロファイルの呼び出し

マネジメントコンソールのプレイグラウンドから作成したアプリケーション推論プロファイルを呼び出してみます。
モデル選択からClaude Sonnet 4を選ぶと作成した推論プロファイルが選択できるようになっていますね。

Capture-2025-05-23-112431

実際にチャットをしてモデルを呼び出してみましたが、問題なく応答してくれました。

2025-05-23-054

プロファイルの確認

以下のコマンドで推論プロファイルの一覧が確認でき、--type-equals APPLICATIONを指定することで作成したアプリケーション推論プロファイルに限定できます。

terminal
aws bedrock list-inference-profiles \
  --type-equals APPLICATION \
  --no-cli-pager
実行結果
{
    "inferenceProfileSummaries": [
        {
            "inferenceProfileName": "Hoge Claude Sonnet 4",
            "createdAt": "2025-05-23T02:22:52.128786+00:00",
            "updatedAt": "2025-05-23T02:22:52.128786+00:00",
            "inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/5czigg0hurg9",
            "models": [
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-south-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-south-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-southeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-southeast-4::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                }
            ],
            "inferenceProfileId": "5czigg0hurg9",
            "status": "ACTIVE",
            "type": "APPLICATION"
        },
        {
            "inferenceProfileName": "Fuga Claude Sonnet 4",
            "createdAt": "2025-05-23T02:23:19.708375+00:00",
            "updatedAt": "2025-05-23T02:23:19.708375+00:00",
            "inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/nz59dlj42ony",
            "models": [
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-south-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-south-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-southeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                },
                {
                    "modelArn": "arn:aws:bedrock:ap-southeast-4::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                }
            ],
            "inferenceProfileId": "nz59dlj42ony",
            "status": "ACTIVE",
            "type": "APPLICATION"
        }
    ]
}

プロファイルの削除

以下のコマンドで作成したアプリケーション推論プロファイルの削除ができます。

terminal
aws bedrock delete-inference-profile \
  --inference-profile-identifier arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/<推論プロファイルID>

まとめ

最近アプリケーション推論プロファイルというワードを目にすることが多ったので実際に作成してみました。
現状Amazon Bedrock APIでしか作成できず辛いので、マネジメントコンソールに対応してくれると嬉しいです。
後日、使用料金が反映されたら追記するかもしれません...
どなたかの参考になれば幸いです。

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.