Amazon Bedrockのモデル仕様やその料金について整理してみた
こんちには。
データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。
Amazon Bedrockがリリースされましたね。この記事ではモデルの仕様やその料金について整理してみました。
なお、記載内容は本日時点での公式情報を参考にしていますのでご了承ください。
Amazon Bedrockについて
AWSで基盤モデルをマネージドで扱うことができるAmazon BedrockがGAとなりました。
公式情報は以下のあたりとなります。
- Amazon Bedrock is now generally available
- Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models | AWS News Blog
- Announcing New Tools to Help Every Business Embrace Generative AI | AWS Machine Learning Blog
公式ドキュメントも以下にありました。
Amazon Bedrockの要点は以下の通りです。
- 生成AIアプリケーションの構築に必要な幅広い機能を提供するフルマネージドサービス
- モデルについて
- AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazonなどの企業が提供する高性能な基盤モデルの選択肢
- Metaの大規模言語モデル(LLM)であるLlama 2は今後数週間後に提供予定
- Llama 2 on Amazon Bedrock – AWS
- Provisioned Throughput
- 一定以上のスループットを1時間単位の料金で利用可能
- スループットは1分あたりの入出力トークン数として定義
- プライバシーとセキュリティ
- 規制の厳しい業界での構築に対応し、HIPAA適格性とGDPRコンプライアンスを達成
- Amazon CloudWatchやAWS CloudTrailと統合されており、監査や監視が可能
また上記の公式情報でも触れられていましたが、Amazon BedrockのGAと同時に、Amazon Titanのテキスト埋め込みモデルもGAとなっています。
各モデルの仕様
各モデルの仕様をマネジメントコンソールから確認して整理しました。
model | model version | max tokens | languages | model attributes | supported use cases |
---|---|---|---|---|---|
[AI21] Jurassic-2 Mid | v1 | 8191 | English Spanish French German Portuguese Italian Dutch |
Text Classification Insert/edit Math |
Open book question answering summarization draft generation information extraction ideation |
[AI21] Jurassic-2 Ultra | v1 | 8191 | English Spanish French German Portuguese Italian Dutch |
Text Classification Insert/edit Math |
Open book question answering summarization draft generation information extraction ideation |
[Amazon] Titan Text - Express | v1 | 8k | English | Text generation Code generation Instruction following |
Open ended text generation brainstorming summarization code generation table creation data formatting paraphrasing chain of though rewrite extraction Q&A chat |
[Anthropic] Claude Instant | v1.2 | 100k | English and multiple other languages | Text generation Conversational |
Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citatio |
[Anthropic] Claude | v1.3 v2 |
100k | English and multiple other languages | Text generation Conversational |
Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citatio |
[Cohere] Command | v14.6 | 4096 | English | Text-to-text Model size: 52B parameters |
Text generation text summarization |
[Amazon] Titan Embeddings | v1.2 | 8k | Multilingual | Output vector size = 1,536 | text retrieval semantic similarity clustering |
[Stability AI] SDXL | v0.8 | 8192 | English | Text-to-image | image generation image editing |
トークン数が多いものとしてClaudeモデルが準備されている点が特徴です。
languageが多言語に対応して良そうなのは以下の3種類となりそうです。(1つは埋め込みモデル)
- [Anthropic] Claude Instant
- [Anthropic] Claude
- [Amazon] Titan Embeddings
埋め込みベクトルは、1536次元のベクトルを生成するものとなっています。(OpenAIのtext-embedding-ada-002と同様)
なお、後述するPricingには記載のある以下の2つのモデルはマネジメントコンソールから確認できませんでしたので、確認次第追記しようと思います。
- [Amazon] Titan Text - Lite
- [Stability AI] SDXL1.0
Pricing
正確な情報は公式も参照ください
費用体系は大きく以下の3つに分けられるようです。
- On-Demand
- 使用した分だけ料金が発生
- テキストの場合トークン数、画像の場合は画像毎数枚に料金が発生
- Provisioned Throughput
- モデル・ユニットごとに1時間あたりで料金が発生
- コミットメント期間に応じて料金が変動する仕組み(無し、1ヵ月、6ヵ月)
- 特定のベースモデル、または後述するカスタムモデル用に予約されたスループットをモデル・ユニットとして購入可能
- ベースモデルはカスタムされていないモデルという意味
- モデル・ユニットは、1分間に処理される入力または出力トークンの最大数によって測定される一定のスループットを提供
- Model customization (fine-tuning)
- モデルによって学習時に処理されるトークン数(学習データ全体のトークン数×エポック数)に基づいて料金が発生
- エポック数は、fine-tuningプロセスにおいて学習データをなめる回数を指す
- これ以外に、モデルのストレージ容量についてモデルごとに月単位で料金が発生
- Model customizationで作成したカスタムモデルは、前述のProvisioned Throughputでのみ利用可能なので注意
- その際、Provisioned Throughputをコミットメント期間無しで利用できるのは1モデル・ユニットまで
これらについて、全てのモデルがこれらに対応しているわけではないですので、以下に種類毎に整理しています。
(On-Demand料金については当ブログでも以下の記事で言及されておりますが重複をご容赦ください)
テキスト生成モデル
テキスト生成モデルのPricing情報は以下となります。
- On-Demand
model | input | output |
---|---|---|
[AI21] Jurassic-2 Mid | $0.0125 per 1k token | $0.0125 per 1k token |
[AI21] Jurassic-2 Ultra | $0.0188 per 1k token | $0.0188 per 1k token |
[Amazon] Titan Text - Lite | $0.0003 per 1k token | $0.0004 per 1k token |
[Amazon] Titan Text - Express | $0.0013 per 1k token | $0.0017 per 1k token |
[Anthropic] Claude Instant | $0.00163 per 1k token | $0.00551 per 1k token |
[Anthropic] Claude | $0.01102 per 1k token | $0.03268 per 1k token |
[Cohere] Command | $0.0015 per 1k token | $0.0020 per 1k token |
- Provisioned Throughput
model | コミットメント期間 | pricing |
---|---|---|
[Amazon] Titan Text - Lite | なし | $7.10 per hour |
[Amazon] Titan Text - Lite | 1ヵ月 | $6.40 per hour |
[Amazon] Titan Text - Lite | 6ヵ月 | $5.10 per hour |
[Amazon] Titan Text - Express | なし | $20.50 per hour |
[Amazon] Titan Text - Express | 1ヵ月 | $18.40 per hour |
[Amazon] Titan Text - Express | 6ヵ月 | $14.80 per hour |
[Anthropic] Claude Instant | 1ヵ月 | $39.60 per hour |
[Anthropic] Claude Instant | 6ヵ月 | $22.00 per hour |
[Anthropic] Claude | 1ヵ月 | $63.00 per hour |
[Anthropic] Claude | 6ヵ月 | $35.00 per hour |
- Model customization (fine-tuning)
model | トレーニングデータ単位 | カスタムされたモデルの保存容量 |
---|---|---|
[Amazon] Titan Text - Lite | $0.0004 per 1k token | $1.95 per month each model |
[Amazon] Titan Text - Express | $0.0008 per 1k token | $1.95 per month each model |
Provisioned Throughputに対応しているのは、AmazonのTitanとAnthropicのClaudeのみとなっています。
Model customizationに対応しているのは、AmazonのTitanのみです。
逆に、AI21とCohereのモデルはOn-Demandだけに対応しているという状況になります。
Provisioned Throughputは常時稼働させると、月額で数十万~数百万円かかるケースもありますので、念頭に置いておきましょう。
参考:OpenAIとの比較
なお、OpenAIのモデルと並べてみるとトークン当たりの料金は以下のような感じとなります。
(入力側の料金順に並べてみました)
model | input | output |
---|---|---|
[Amazon] Titan Text - Lite | $0.0003 per 1k token | $0.0004 per 1k token |
[Amazon] Titan Text - Express | $0.0013 per 1k token | $0.0017 per 1k token |
[Anthropic] Claude Instant | $0.00163 per 1k token | $0.00551 per 1k token |
[Cohere] Command | $0.0015 per 1k token | $0.0020 per 1k token |
[OpenAI] gpt-3.5-turbo | $0.0015 per 1k token | $0.002 per 1k token |
[OpenAI] gpt-3.5-turbo-16k | $0.003 per 1k token | $0.004 per 1k token |
[Anthropic] Claude | $0.01102 per 1k token | $0.03268 per 1k token |
[AI21] Jurassic-2 Mid | $0.0125 per 1k token | $0.0125 per 1k token |
[AI21] Jurassic-2 Ultra | $0.0188 per 1k token | $0.0188 per 1k token |
[OpenAI] gpt-4 | $0.03 per 1k token | $0.06 per 1k token |
[OpenAI] gpt-4-32k | $0.06 per 1k token | $0.12 per 1k token |
GPT-4は一つ価格的にも抜けていることがわかります。最も低価格なのはTitanのようです。
GPT-3.5-turboと同価格帯なのは以下かなと思えます。
- [Amazon] Titan Text - Express
- [Anthropic] Claude Instant
- [Cohere] Command
テキスト埋め込みモデル
テキスト埋め込みモデルのPricing情報は以下となります。
- On-Demand
model | input |
---|---|
[Amazon] Titan Embeddings | $0.0001 per 1k token |
- Provisioned Throughput
model | コミットメント期間 | pricing |
---|---|---|
[Amazon] Titan Embeddings | 1ヵ月 | $6.40 per hour |
[Amazon] Titan Embeddings | 6ヵ月 | $5.10 per hour |
Amazon Titanのモデルのみがある状況です。
Provisioned Throughputの価格は、テキスト生成モデルの「Titan Text - Lite」と同程度となっていまね。
On-Demandの料金は、OpenAIのtext-embedding-ada-002と同額となっています。
次元数も同じなので比較してみると面白そうですね。
画像生成モデル
画像生成モデルのPricing情報は以下となります。
- On-Demand
models | 画像解像度 | quality | pricing |
---|---|---|---|
[Stability AI] SDXL0.8 | 512x512 or smaller | Standard quality (51 steps) | $0.036 per image |
[Stability AI] SDXL0.8 | Larger than 512x512 | Standard quality (51 steps) | $0.072 per image |
- Provisioned Throughput
model | コミットメント期間 | pricing |
---|---|---|
[Stability AI] SDXL1.0 | 1ヵ月 | $49.86 per hour |
[Stability AI] SDXL1.0 | 6ヵ月 | $46.18 per hour |
On-DemandとProvisioned Throughputでモデルのバージョンが変わっている点は注意が必要そうです。
その他
Generative BI (Preview)
Amazon QuickSight向けの機能としてGenerative BIの機能が追加されているようです(プレビュー)。
こちらは、自然言語で閲覧したいものを指定することで、可視化を構築できるような機能のようです。
詳細は以下の公式ブログもご参照ください。
Agents for Amazon Bedrock (Limited Preview)
公式ドキュメントに以下のように記載されています。
The following capabilities are in limited preview release. To request access, contact your AWS account manager. - Agents for Amazon Bedrock – Build agents to perform orchestration and carry out tasks for your customers. - Knowledge base for Amazon Bedrock – Draw from data sources to help your agent find information for your customers.
こちらも登場が期待されますが、まだLimited Previewのようです。
公式ブログ等では言及され始めていますので、もう少し待ちましょう
- プレビュー – 基盤モデルでタスクを完了させるための Agents for Amazon Bedrock | Amazon Web Services ブログ
- Preview – Connect Foundation Models to Your Company Data Sources with Agents for Amazon Bedrock | AWS News Blog
まとめ
いかがでしたでしょうか。
「やってみた」記事では無くて恐縮ですが、本記事が多くの方に「やってもらう」ためのご参考になれば幸いです。