[アップデート] Amazon Novaシリーズモデルが登場しました #AWSreInvent
こんにちは、@TakaakiKakei です。
2024年12月2日~12月6日(米国太平洋標準時)に開催されるAWS re:Invent 2024に関連して、以下のアップデートについてご紹介します。
- Amazon BedrockにNovaシリーズモデルが登場
Announcing Amazon Nova foundation models available today in Amazon Bedrock
いきなりまとめ
- Amazon Bedrockに、Amazon Novaシリーズモデルが追加
- Nova Reel
- Nova Pro
- Nova Lite
- Nova Micro
- Nova Canvas
- 現在、バージニア北部リージョンで利用可能
- マルチモーダル理解の基盤モデル、画像生成モデル、動画生成モデル
以下、Amazon Novaシリーズモデルについて調査した内容をまとめます。
AWS公式ドキュメント
AWS マネジメントコンソールにアクセスが必要ですが、Amazon Bedrockのモデルページからモデルの概要を確認できます。
モデル概要
Nova Reel
Nova Reel は動画生成モデルです。自然言語プロンプトや画像から最大9秒の短い高精細ビデオを生成できます。
- Model ID:
amazon.nova-reel-v1:0
- Model ARN:
arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-reel-v1:0
- 入力形式: テキスト、画像
- 最大文字制限: 512
- 最大画像サイズ: 24MB
- 言語: 英語
Nova Pro
Nova Proはマルチモーダル理解の基盤モデルです。多言語に対応しており、テキスト、画像、ビデオが推論できます。類似モデルの中でもパワフルなモデルのようです。
- Model ID:
amazon.nova-pro-v1:0
- Model ARN:
arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-pro-v1:0
- 入力形式: テキスト、画像、ビデオ
- 最大トークン: 300K
- 最大画像サイズ: 25MB
- 言語: 200+
Nova Lite
Nova Lite はマルチモーダル理解の基盤モデルです。多言語に対応しており、テキスト、画像、ビデオが推論できます。類似モデルの中でもバランスの良いモデルのようです。
- Model ID:
amazon.nova-lite-v1:0
- Model ARN:
arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-lite-v1:0
- 入力形式: テキスト、画像、ビデオ
- 最大トークン: 300K
- 最大画像サイズ: 25MB
- 言語: 200+
Nova Micro
Nova Micro はText-to-Textな基盤モデルです。多言語に対応しており、テキストを推論できます。類似モデルの中でも軽量なモデルのようです。
- Model ID:
amazon.nova-micro-v1:0
- Model ARN:
arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-micro-v1:0
- 入力形式: テキスト
- 最大トークン: 128K
- 言語: 200+
Nova Canvas
Nova Canvas は画像生成モデルです。ユーザーが既存の画像をアップロードして編集することができます。ユーザーはテキストプロンプトを使って画像を編集したり(マスクなし)、画像マスクを使って画像の一部を編集したり、アウトペインティングで画像の境界を拡張したりすることができます。また、画像のバリエーションを生成することもできます。
- Model ID:
amazon.nova-canvas-v1:0
- Model ARN:
arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-canvas-v1:0
- 入力形式: 画像
- 最大文字数: 1024
- 最大画像サイズ: 24MB
- 言語: 英語
Chat / Text playgroundで試す
Chat / Text playgroundでは以下のモデルを試すことができます。
- Nova Pro
- Nova Lite
- Nova Micro
長めのラップをお願いします!
というプロンプトで、それぞれのモデルの推論結果を確認します。
Nova Pro
- Input: 9
- Output: 472
- Latency: 6589 ms
名前からもパワフルなモデルだと考えられます。
Nova Lite
- Input: 9
- Output: 469
- Latency: 4104 ms
バランスの良いモデルで、Proと比較して、Latencyが少ないようです。
Nova Micro
- Input: 9
- Output: 250
- Latency: 1708 ms
高速なモデルで、圧倒的にLatencyが少ないようです。一方で、Outputは少ないです。テキスト入力のみサポートなのにも注意しましょう。
Iamge / Video playgroundで試す
Nova Reel
生成したビデオの保存先として、S3バケットが必要とのことです。
確認を押下すると、S3バケットが自動で作成されます。
A penguin wearing a pink hoodie and sunglasses
というプロンプトで、動画を生成してみます。英語で入力が必要です。
生成には5分くらい時間がかかるとのことです。
こんな動画が生成されました。
Nova Canvas
こちらがプレイグラウンドの画面です。
いくつかのアクションが選択可能です。
アクションは画像生成
のままで、A penguin wearing a pink hoodie and sunglasses
というプロンプトで、画像を生成してみます。
生成された画像を押下すると、拡大され、生成画像情報を確認できます。
画像右上の三点リーダーから、バリエーションを作成できます。
作成されたバリエーションが以下です。
他にも、アップロードした画像の背景を変更できたりもします。
さいごに
待望のAmazon Novaシリーズモデルが登場しました。今後、様々なユースケースで各モデルを利用して使い所を見極めていきたいと思います。
それではまた!