Amazon Bedrockのアプリケーション推論プロファイルを作成〜削除までやってみた【Claude 4】
はじめに
生成AIアプリケーションやコーディングエージェントを使用する場合、モデルの使用状況やコストの可視化が重要な課題となっています。
特にコーディングエージェントでのモデル利用はコストが肥大化することが多々あり、適切にコスト管理する必要があります。
今回はアプリケーション推論プロファイルを使用して、ユーザー毎に専用プロファイルを作成してみます。
アプリケーション推論プロファイルとは
Amazon Bedrockには2種類の推論プロファイルがあり、その内アプリケーション推論プロファイルはユーザーで作成可能なものとなります。
クロスリージョン(システム定義)推論プロファイル – Amazon Bedrockで事前定義され、モデルへのリクエストをルーティングできる複数のリージョンを含む推論プロファイル。
アプリケーション推論プロファイル – コストとモデルの使用を追跡するためにユーザーが作成する推論プロファイル。モデル呼び出しリクエストを1つのリージョンまたは複数のリージョンにルーティングする推論プロファイルを作成できます。
1つのリージョンでモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルがリクエストをルーティングするリージョンで基盤モデルを指定します
複数のリージョンにわたるモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルがリクエストをルーティングするモデルとリージョンを定義するクロスリージョン(システム定義)推論プロファイルを指定します。
やってみた
プロファイルの作成
まずはじめにプロファイルの作成から行います。
推論プロファイルはAmazon Bedrock API
を使用してのみ作成可能なためAWS CLIで作成します。
嬉しいことにBedrockでもClaude 4が使えるようになったので、今回はClaude Sonnet 4
のクロスリージョン推論プロファイルをコピー元として設定します。
aws bedrock create-inference-profile \
--inference-profile-name <プロファイル名> \
--model-source copyFrom=arn:aws:bedrock:a:ap-northeast-1:inference-profile/apac.anthropic.claude-sonnet-4-20250514-v1:0 \
--tags key=<タグキー>,value=<タグ値> \
--no-cli-pager
実行結果
{
"inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/5czigg0hurg9",
"status": "ACTIVE"
}
プロファイルの呼び出し
マネジメントコンソールのプレイグラウンドから作成したアプリケーション推論プロファイルを呼び出してみます。
モデル選択からClaude Sonnet 4
を選ぶと作成した推論プロファイルが選択できるようになっていますね。
実際にチャットをしてモデルを呼び出してみましたが、問題なく応答してくれました。
プロファイルの確認
以下のコマンドで推論プロファイルの一覧が確認でき、--type-equals APPLICATION
を指定することで作成したアプリケーション推論プロファイルに限定できます。
aws bedrock list-inference-profiles \
--type-equals APPLICATION \
--no-cli-pager
実行結果
{
"inferenceProfileSummaries": [
{
"inferenceProfileName": "Hoge Claude Sonnet 4",
"createdAt": "2025-05-23T02:22:52.128786+00:00",
"updatedAt": "2025-05-23T02:22:52.128786+00:00",
"inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/5czigg0hurg9",
"models": [
{
"modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-northeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-south-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-south-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-4::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
}
],
"inferenceProfileId": "5czigg0hurg9",
"status": "ACTIVE",
"type": "APPLICATION"
},
{
"inferenceProfileName": "Fuga Claude Sonnet 4",
"createdAt": "2025-05-23T02:23:19.708375+00:00",
"updatedAt": "2025-05-23T02:23:19.708375+00:00",
"inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/nz59dlj42ony",
"models": [
{
"modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-northeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-south-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-south-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-1::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
},
{
"modelArn": "arn:aws:bedrock:ap-southeast-4::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
}
],
"inferenceProfileId": "nz59dlj42ony",
"status": "ACTIVE",
"type": "APPLICATION"
}
]
}
プロファイルの削除
以下のコマンドで作成したアプリケーション推論プロファイルの削除ができます。
aws bedrock delete-inference-profile \
--inference-profile-identifier arn:aws:bedrock:ap-northeast-1:123456789012:application-inference-profile/<推論プロファイルID>
まとめ
最近アプリケーション推論プロファイルというワードを目にすることが多ったので実際に作成してみました。
現状Amazon Bedrock API
でしか作成できず辛いので、マネジメントコンソールに対応してくれると嬉しいです。
後日、使用料金が反映されたら追記するかもしれません...
どなたかの参考になれば幸いです。