話題の記事

Amazon Bedrockのモデル仕様やその料金について整理してみた

nokomoro3

2023.09.29

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんちには。

データアナリティクス事業本部インテグレーション部機械学習チームの中村です。

Amazon Bedrockがリリースされましたね。この記事ではモデルの仕様やその料金について整理してみました。

なお、記載内容は本日時点での公式情報を参考にしていますのでご了承ください。

Amazon Bedrockについて

AWSで基盤モデルをマネージドで扱うことができるAmazon BedrockがGAとなりました。

公式情報は以下のあたりとなります。

公式ドキュメントも以下にありました。

Amazon Bedrock Documentation

Amazon Bedrockの要点は以下の通りです。

生成AIアプリケーションの構築に必要な幅広い機能を提供するフルマネージドサービス
モデルについて
- AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazonなどの企業が提供する高性能な基盤モデルの選択肢
- Metaの大規模言語モデル（LLM）であるLlama 2は今後数週間後に提供予定
- Llama 2 on Amazon Bedrock – AWS
Provisioned Throughput
- 一定以上のスループットを1時間単位の料金で利用可能
- スループットは1分あたりの入出力トークン数として定義
プライバシーとセキュリティ
- 規制の厳しい業界での構築に対応し、HIPAA適格性とGDPRコンプライアンスを達成
- Amazon CloudWatchやAWS CloudTrailと統合されており、監査や監視が可能

また上記の公式情報でも触れられていましたが、Amazon BedrockのGAと同時に、Amazon Titanのテキスト埋め込みモデルもGAとなっています。

Amazon Titan Embeddings is now generally available

各モデルの仕様

各モデルの仕様をマネジメントコンソールから確認して整理しました。

model	model version	max tokens	languages	model attributes	supported use cases
[AI21] Jurassic-2 Mid	v1	8191	English Spanish French German Portuguese Italian Dutch	Text Classification Insert/edit Math	Open book question answering summarization draft generation information extraction ideation
[AI21] Jurassic-2 Ultra	v1	8191	English Spanish French German Portuguese Italian Dutch	Text Classification Insert/edit Math	Open book question answering summarization draft generation information extraction ideation
[Amazon] Titan Text - Express	v1	8k	English	Text generation Code generation Instruction following	Open ended text generation brainstorming summarization code generation table creation data formatting paraphrasing chain of though rewrite extraction Q&A chat
[Anthropic] Claude Instant	v1.2	100k	English and multiple other languages	Text generation Conversational	Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citatio
[Anthropic] Claude	v1.3 v2	100k	English and multiple other languages	Text generation Conversational	Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citatio
[Cohere] Command	v14.6	4096	English	Text-to-text Model size: 52B parameters	Text generation text summarization
[Amazon] Titan Embeddings	v1.2	8k	Multilingual	Output vector size = 1,536	text retrieval semantic similarity clustering
[Stability AI] SDXL	v0.8	8192	English	Text-to-image	image generation image editing

トークン数が多いものとしてClaudeモデルが準備されている点が特徴です。

languageが多言語に対応して良そうなのは以下の3種類となりそうです。（１つは埋め込みモデル）

[Anthropic] Claude Instant
[Anthropic] Claude
[Amazon] Titan Embeddings

埋め込みベクトルは、1536次元のベクトルを生成するものとなっています。（OpenAIのtext-embedding-ada-002と同様）

なお、後述するPricingには記載のある以下の２つのモデルはマネジメントコンソールから確認できませんでしたので、確認次第追記しようと思います。

[Amazon] Titan Text - Lite
[Stability AI] SDXL1.0

Pricing

正確な情報は公式も参照ください

Build Generative AI Applications with Foundation Models - Amazon Bedrock Pricing - AWS

費用体系は大きく以下の３つに分けられるようです。

On-Demand
- 使用した分だけ料金が発生
- テキストの場合トークン数、画像の場合は画像毎数枚に料金が発生
Provisioned Throughput
- モデル・ユニットごとに1時間あたりで料金が発生
- コミットメント期間に応じて料金が変動する仕組み（無し、1ヵ月、6ヵ月）
- 特定のベースモデル、または後述するカスタムモデル用に予約されたスループットをモデル・ユニットとして購入可能
- ベースモデルはカスタムされていないモデルという意味
- モデル・ユニットは、1分間に処理される入力または出力トークンの最大数によって測定される一定のスループットを提供
Model customization (fine-tuning)
- モデルによって学習時に処理されるトークン数（学習データ全体のトークン数×エポック数）に基づいて料金が発生
- エポック数は、fine-tuningプロセスにおいて学習データをなめる回数を指す
- これ以外に、モデルのストレージ容量についてモデルごとに月単位で料金が発生
- Model customizationで作成したカスタムモデルは、前述のProvisioned Throughputでのみ利用可能なので注意
- その際、Provisioned Throughputをコミットメント期間無しで利用できるのは1モデル・ユニットまで

これらについて、全てのモデルがこれらに対応しているわけではないですので、以下に種類毎に整理しています。

（On-Demand料金については当ブログでも以下の記事で言及されておりますが重複をご容赦ください）

AWSの生成AIサービス Amazon Bedrock がリリースされました | DevelopersIO

テキスト生成モデル

テキスト生成モデルのPricing情報は以下となります。

On-Demand

model	input	output
[AI21] Jurassic-2 Mid	$0.0125 per 1k token	$0.0125 per 1k token
[AI21] Jurassic-2 Ultra	$0.0188 per 1k token	$0.0188 per 1k token
[Amazon] Titan Text - Lite	$0.0003 per 1k token	$0.0004 per 1k token
[Amazon] Titan Text - Express	$0.0013 per 1k token	$0.0017 per 1k token
[Anthropic] Claude Instant	$0.00163 per 1k token	$0.00551 per 1k token
[Anthropic] Claude	$0.01102 per 1k token	$0.03268 per 1k token
[Cohere] Command	$0.0015 per 1k token	$0.0020 per 1k token

Provisioned Throughput

model	コミットメント期間	pricing
[Amazon] Titan Text - Lite	なし	$7.10 per hour
[Amazon] Titan Text - Lite	1ヵ月	$6.40 per hour
[Amazon] Titan Text - Lite	6ヵ月	$5.10 per hour
[Amazon] Titan Text - Express	なし	$20.50 per hour
[Amazon] Titan Text - Express	1ヵ月	$18.40 per hour
[Amazon] Titan Text - Express	6ヵ月	$14.80 per hour
[Anthropic] Claude Instant	1ヵ月	$39.60 per hour
[Anthropic] Claude Instant	6ヵ月	$22.00 per hour
[Anthropic] Claude	1ヵ月	$63.00 per hour
[Anthropic] Claude	6ヵ月	$35.00 per hour

Model customization (fine-tuning)

model	トレーニングデータ単位	カスタムされたモデルの保存容量
[Amazon] Titan Text - Lite	$0.0004 per 1k token	$1.95 per month each model
[Amazon] Titan Text - Express	$0.0008 per 1k token	$1.95 per month each model

Provisioned Throughputに対応しているのは、AmazonのTitanとAnthropicのClaudeのみとなっています。

Model customizationに対応しているのは、AmazonのTitanのみです。

逆に、AI21とCohereのモデルはOn-Demandだけに対応しているという状況になります。

Provisioned Throughputは常時稼働させると、月額で数十万～数百万円かかるケースもありますので、念頭に置いておきましょう。

参考：OpenAIとの比較

なお、OpenAIのモデルと並べてみるとトークン当たりの料金は以下のような感じとなります。

（入力側の料金順に並べてみました）

model	input	output
[Amazon] Titan Text - Lite	$0.0003 per 1k token	$0.0004 per 1k token
[Amazon] Titan Text - Express	$0.0013 per 1k token	$0.0017 per 1k token
[Anthropic] Claude Instant	$0.00163 per 1k token	$0.00551 per 1k token
[Cohere] Command	$0.0015 per 1k token	$0.0020 per 1k token
[OpenAI] gpt-3.5-turbo	$0.0015 per 1k token	$0.002 per 1k token
[OpenAI] gpt-3.5-turbo-16k	$0.003 per 1k token	$0.004 per 1k token
[Anthropic] Claude	$0.01102 per 1k token	$0.03268 per 1k token
[AI21] Jurassic-2 Mid	$0.0125 per 1k token	$0.0125 per 1k token
[AI21] Jurassic-2 Ultra	$0.0188 per 1k token	$0.0188 per 1k token
[OpenAI] gpt-4	$0.03 per 1k token	$0.06 per 1k token
[OpenAI] gpt-4-32k	$0.06 per 1k token	$0.12 per 1k token

GPT-4は一つ価格的にも抜けていることがわかります。最も低価格なのはTitanのようです。

GPT-3.5-turboと同価格帯なのは以下かなと思えます。

[Amazon] Titan Text - Express
[Anthropic] Claude Instant
[Cohere] Command

テキスト埋め込みモデル

テキスト埋め込みモデルのPricing情報は以下となります。

On-Demand

model	input
[Amazon] Titan Embeddings	$0.0001 per 1k token

Provisioned Throughput

model	コミットメント期間	pricing
[Amazon] Titan Embeddings	1ヵ月	$6.40 per hour
[Amazon] Titan Embeddings	6ヵ月	$5.10 per hour

Amazon Titanのモデルのみがある状況です。

Provisioned Throughputの価格は、テキスト生成モデルの「Titan Text - Lite」と同程度となっていまね。

On-Demandの料金は、OpenAIのtext-embedding-ada-002と同額となっています。

次元数も同じなので比較してみると面白そうですね。

画像生成モデル

画像生成モデルのPricing情報は以下となります。

On-Demand

models	画像解像度	quality	pricing
[Stability AI] SDXL0.8	512x512 or smaller	Standard quality (51 steps)	$0.036 per image
[Stability AI] SDXL0.8	Larger than 512x512	Standard quality (51 steps)	$0.072 per image

Provisioned Throughput

model	コミットメント期間	pricing
[Stability AI] SDXL1.0	1ヵ月	$49.86 per hour
[Stability AI] SDXL1.0	6ヵ月	$46.18 per hour

On-DemandとProvisioned Throughputでモデルのバージョンが変わっている点は注意が必要そうです。

その他

Generative BI (Preview)

Amazon QuickSight向けの機能としてGenerative BIの機能が追加されているようです（プレビュー）。

Generative BI dashboard authoring capabilities for Amazon QuickSight (Preview)

こちらは、自然言語で閲覧したいものを指定することで、可視化を構築できるような機能のようです。

詳細は以下の公式ブログもご参照ください。

Generative BI dashboard authoring capabilities now available in preview for Amazon QuickSight Q customers | AWS Business Intelligence Blog

Agents for Amazon Bedrock (Limited Preview)

公式ドキュメントに以下のように記載されています。

https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-service.html

The following capabilities are in limited preview release. To request access, contact your AWS account manager. - Agents for Amazon Bedrock – Build agents to perform orchestration and carry out tasks for your customers. - Knowledge base for Amazon Bedrock – Draw from data sources to help your agent find information for your customers.

こちらも登場が期待されますが、まだLimited Previewのようです。

公式ブログ等では言及され始めていますので、もう少し待ちましょう

まとめ

いかがでしたでしょうか。

「やってみた」記事では無くて恐縮ですが、本記事が多くの方に「やってもらう」ためのご参考になれば幸いです。

Amazon Bedrockのモデル仕様やその料金について整理してみた

Amazon Bedrockについて

各モデルの仕様

Pricing

テキスト生成モデル

参考：OpenAIとの比較

テキスト埋め込みモデル

画像生成モデル

その他

Generative BI (Preview)

Agents for Amazon Bedrock (Limited Preview)

まとめ

関連記事

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

EVENTS