Amazon Bedrockのモデル仕様やその料金について整理してみた

2023.09.29

こんちには。

データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。

Amazon Bedrockがリリースされましたね。この記事ではモデルの仕様やその料金について整理してみました。

なお、記載内容は本日時点での公式情報を参考にしていますのでご了承ください。

Amazon Bedrockについて

AWSで基盤モデルをマネージドで扱うことができるAmazon BedrockがGAとなりました。

公式情報は以下のあたりとなります。

公式ドキュメントも以下にありました。

Amazon Bedrockの要点は以下の通りです。

  • 生成AIアプリケーションの構築に必要な幅広い機能を提供するフルマネージドサービス
  • モデルについて
    • AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazonなどの企業が提供する高性能な基盤モデルの選択肢
    • Metaの大規模言語モデル(LLM)であるLlama 2は今後数週間後に提供予定
    • Llama 2 on Amazon Bedrock – AWS
  • Provisioned Throughput
    • 一定以上のスループットを1時間単位の料金で利用可能
    • スループットは1分あたりの入出力トークン数として定義
  • プライバシーとセキュリティ
    • 規制の厳しい業界での構築に対応し、HIPAA適格性とGDPRコンプライアンスを達成
    • Amazon CloudWatchやAWS CloudTrailと統合されており、監査や監視が可能

また上記の公式情報でも触れられていましたが、Amazon BedrockのGAと同時に、Amazon Titanのテキスト埋め込みモデルもGAとなっています。

各モデルの仕様

各モデルの仕様をマネジメントコンソールから確認して整理しました。

model model version max tokens languages model attributes supported use cases
[AI21] Jurassic-2 Mid v1 8191 English
Spanish
French
German
Portuguese
Italian
Dutch
Text
Classification
Insert/edit
Math
Open book question answering
summarization
draft generation
information extraction
ideation
[AI21] Jurassic-2 Ultra v1 8191 English
Spanish
French
German
Portuguese
Italian
Dutch
Text
Classification
Insert/edit
Math
Open book question answering
summarization
draft generation
information extraction
ideation
[Amazon] Titan Text - Express v1 8k English Text generation
Code generation
Instruction following
Open ended text generation
brainstorming
summarization
code generation
table creation
data formatting
paraphrasing
chain of though
rewrite
extraction
Q&A
chat
[Anthropic] Claude Instant v1.2 100k English and multiple other languages Text generation
Conversational
Question answering
information extraction
removing PII
content generation
multiple choice classification
Roleplay
comparing text
summarization
document Q&A with citatio
[Anthropic] Claude v1.3
v2
100k English and multiple other languages Text generation
Conversational
Question answering
information extraction
removing PII
content generation
multiple choice classification
Roleplay
comparing text
summarization
document Q&A with citatio
[Cohere] Command v14.6 4096 English Text-to-text
Model size: 52B parameters
Text generation
text summarization
[Amazon] Titan Embeddings v1.2 8k Multilingual Output vector size = 1,536 text retrieval
semantic similarity
clustering
[Stability AI] SDXL v0.8 8192 English Text-to-image image generation
image editing

トークン数が多いものとしてClaudeモデルが準備されている点が特徴です。

languageが多言語に対応して良そうなのは以下の3種類となりそうです。(1つは埋め込みモデル)

  • [Anthropic] Claude Instant
  • [Anthropic] Claude
  • [Amazon] Titan Embeddings

埋め込みベクトルは、1536次元のベクトルを生成するものとなっています。(OpenAIのtext-embedding-ada-002と同様)

なお、後述するPricingには記載のある以下の2つのモデルはマネジメントコンソールから確認できませんでしたので、確認次第追記しようと思います。

  • [Amazon] Titan Text - Lite
  • [Stability AI] SDXL1.0

Pricing

正確な情報は公式も参照ください

費用体系は大きく以下の3つに分けられるようです。

  • On-Demand
    • 使用した分だけ料金が発生
    • テキストの場合トークン数、画像の場合は画像毎数枚に料金が発生
  • Provisioned Throughput
    • モデル・ユニットごとに1時間あたりで料金が発生
    • コミットメント期間に応じて料金が変動する仕組み(無し、1ヵ月、6ヵ月)
    • 特定のベースモデル、または後述するカスタムモデル用に予約されたスループットをモデル・ユニットとして購入可能
    • ベースモデルはカスタムされていないモデルという意味
    • モデル・ユニットは、1分間に処理される入力または出力トークンの最大数によって測定される一定のスループットを提供
  • Model customization (fine-tuning)
    • モデルによって学習時に処理されるトークン数(学習データ全体のトークン数×エポック数)に基づいて料金が発生
    • エポック数は、fine-tuningプロセスにおいて学習データをなめる回数を指す
    • これ以外に、モデルのストレージ容量についてモデルごとに月単位で料金が発生
    • Model customizationで作成したカスタムモデルは、前述のProvisioned Throughputでのみ利用可能なので注意
    • その際、Provisioned Throughputをコミットメント期間無しで利用できるのは1モデル・ユニットまで

これらについて、全てのモデルがこれらに対応しているわけではないですので、以下に種類毎に整理しています。

(On-Demand料金については当ブログでも以下の記事で言及されておりますが重複をご容赦ください)

テキスト生成モデル

テキスト生成モデルのPricing情報は以下となります。

  • On-Demand
model input output
[AI21] Jurassic-2 Mid $0.0125 per 1k token $0.0125 per 1k token
[AI21] Jurassic-2 Ultra $0.0188 per 1k token $0.0188 per 1k token
[Amazon] Titan Text - Lite $0.0003 per 1k token $0.0004 per 1k token
[Amazon] Titan Text - Express $0.0013 per 1k token $0.0017 per 1k token
[Anthropic] Claude Instant $0.00163 per 1k token $0.00551 per 1k token
[Anthropic] Claude $0.01102 per 1k token $0.03268 per 1k token
[Cohere] Command $0.0015 per 1k token $0.0020 per 1k token
  • Provisioned Throughput
model コミットメント期間 pricing
[Amazon] Titan Text - Lite なし $7.10 per hour
[Amazon] Titan Text - Lite 1ヵ月 $6.40 per hour
[Amazon] Titan Text - Lite 6ヵ月 $5.10 per hour
[Amazon] Titan Text - Express なし $20.50 per hour
[Amazon] Titan Text - Express 1ヵ月 $18.40 per hour
[Amazon] Titan Text - Express 6ヵ月 $14.80 per hour
[Anthropic] Claude Instant 1ヵ月 $39.60 per hour
[Anthropic] Claude Instant 6ヵ月 $22.00 per hour
[Anthropic] Claude 1ヵ月 $63.00 per hour
[Anthropic] Claude 6ヵ月 $35.00 per hour
  • Model customization (fine-tuning)
model トレーニングデータ単位 カスタムされたモデルの保存容量
[Amazon] Titan Text - Lite $0.0004 per 1k token $1.95 per month each model
[Amazon] Titan Text - Express $0.0008 per 1k token $1.95 per month each model

Provisioned Throughputに対応しているのは、AmazonのTitanとAnthropicのClaudeのみとなっています。

Model customizationに対応しているのは、AmazonのTitanのみです。

逆に、AI21とCohereのモデルはOn-Demandだけに対応しているという状況になります。

Provisioned Throughputは常時稼働させると、月額で数十万~数百万円かかるケースもありますので、念頭に置いておきましょう。

参考:OpenAIとの比較

なお、OpenAIのモデルと並べてみるとトークン当たりの料金は以下のような感じとなります。

(入力側の料金順に並べてみました)

model input output
[Amazon] Titan Text - Lite $0.0003 per 1k token $0.0004 per 1k token
[Amazon] Titan Text - Express $0.0013 per 1k token $0.0017 per 1k token
[Anthropic] Claude Instant $0.00163 per 1k token $0.00551 per 1k token
[Cohere] Command $0.0015 per 1k token $0.0020 per 1k token
[OpenAI] gpt-3.5-turbo $0.0015 per 1k token $0.002 per 1k token
[OpenAI] gpt-3.5-turbo-16k $0.003 per 1k token $0.004 per 1k token
[Anthropic] Claude $0.01102 per 1k token $0.03268 per 1k token
[AI21] Jurassic-2 Mid $0.0125 per 1k token $0.0125 per 1k token
[AI21] Jurassic-2 Ultra $0.0188 per 1k token $0.0188 per 1k token
[OpenAI] gpt-4 $0.03 per 1k token $0.06 per 1k token
[OpenAI] gpt-4-32k $0.06 per 1k token $0.12 per 1k token

GPT-4は一つ価格的にも抜けていることがわかります。最も低価格なのはTitanのようです。

GPT-3.5-turboと同価格帯なのは以下かなと思えます。

  • [Amazon] Titan Text - Express
  • [Anthropic] Claude Instant
  • [Cohere] Command

テキスト埋め込みモデル

テキスト埋め込みモデルのPricing情報は以下となります。

  • On-Demand
model input
[Amazon] Titan Embeddings $0.0001 per 1k token
  • Provisioned Throughput
model コミットメント期間 pricing
[Amazon] Titan Embeddings 1ヵ月 $6.40 per hour
[Amazon] Titan Embeddings 6ヵ月 $5.10 per hour

Amazon Titanのモデルのみがある状況です。

Provisioned Throughputの価格は、テキスト生成モデルの「Titan Text - Lite」と同程度となっていまね。

On-Demandの料金は、OpenAIのtext-embedding-ada-002と同額となっています。

次元数も同じなので比較してみると面白そうですね。

画像生成モデル

画像生成モデルのPricing情報は以下となります。

  • On-Demand
models 画像解像度 quality pricing
[Stability AI] SDXL0.8 512x512 or smaller Standard quality (51 steps) $0.036 per image
[Stability AI] SDXL0.8 Larger than 512x512 Standard quality (51 steps) $0.072 per image
  • Provisioned Throughput
model コミットメント期間 pricing
[Stability AI] SDXL1.0 1ヵ月 $49.86 per hour
[Stability AI] SDXL1.0 6ヵ月 $46.18 per hour

On-DemandとProvisioned Throughputでモデルのバージョンが変わっている点は注意が必要そうです。

その他

Generative BI (Preview)

Amazon QuickSight向けの機能としてGenerative BIの機能が追加されているようです(プレビュー)。

こちらは、自然言語で閲覧したいものを指定することで、可視化を構築できるような機能のようです。

詳細は以下の公式ブログもご参照ください。

Agents for Amazon Bedrock (Limited Preview)

公式ドキュメントに以下のように記載されています。

The following capabilities are in limited preview release. To request access, contact your AWS account manager. - Agents for Amazon Bedrock – Build agents to perform orchestration and carry out tasks for your customers. - Knowledge base for Amazon Bedrock – Draw from data sources to help your agent find information for your customers.

こちらも登場が期待されますが、まだLimited Previewのようです。

公式ブログ等では言及され始めていますので、もう少し待ちましょう

まとめ

いかがでしたでしょうか。

「やってみた」記事では無くて恐縮ですが、本記事が多くの方に「やってもらう」ためのご参考になれば幸いです。