[祝] Amazon SageMaker Unified Studio が一般提供開始(GA)しました!
クラウド事業本部コンサルティング部の石川です。ついに Amazon SageMaker Unified Studioの一般提供開始を発表しました。このサービスは、データ分析と人工知能開発を統合した新しい環境として、re:Invent 2024 で発表と同時にプレビューで公開されました。Amazon SageMaker Unified Studioの概要から設定手順、一般提供開始までの変更点まで、包括的に解説します。
Amazon SageMaker Unified Studio とは
Amazon SageMaker Unified Studioは、AWSが提供するデータ分析とAI/ML開発のための統合開発環境です。従来のAmazon SageMakerでも機械学習の開発環境は提供されていましたが、SageMaker Unified Studioの最大の特徴は、他のAWSサービスとのシームレスな統合にあります。特に、Amazon Athena、Amazon Redshift、AWS Glue、Amazon EMR、Amazon Bedrock、Amazon SageMaker AIなど、複数のAWSサービスの機能にアクセスできることが大きな違いです。
2024年末にre:Inventで発表されてから約4ヶ月の時間をかけ、プレビュー段階を経て、ついに本格的な商用利用が可能になりました。このプラットフォームは、データサイエンティスト、ML開発者、データアナリスト、そして生成AIアプリケーション開発者が、単一の統合環境でシームレスに作業できるように設計されています。
さらに、Amazon Q Developerの一般提供とAmazon Bedrockの主要機能の統合がSageMaker Unified Studioで同時に発表されたことです。データから人工知能開発までの全工程を一貫して実行できる環境が整いました。複数のツールを行き来する必要がなくなり、組織全体のデータ活用と人工知能開発の効率化が期待されています。
Amazon SageMaker Unified Studio の構成や仕組み
Amazon SageMaker Unified Studio の構成や仕組みについてはこちらのブログをご覧ください。
Amazon SageMaker Unified Studio の設定手順
Amazon SageMaker Unified Studio の設定方法や、Amazon SageMaker Lakehouseを利用するまでの流れについてはこちらのブログをご覧ください。
一般提供開始(GA)の変更点
Amazon SageMaker Unified Studio の設定手順
以下のブログは、プレビュー時点の情報ですが、新たに再検証しましたがAmazon SageMaker Lakehouseを利用するまでの流れについて、気付いた変更点を列挙します。
生成AIリソース
新たに「モデルのプロビジョニングロール」と「モデルの消費ロール」が追加になりました。
Amazon SageMaker Lakehouseのプロジェクト作成
「クイックセットアップ (探索に推奨)」にて、Unified Studio ドメインを作成する場合、プレビューではオプション指定であった「workgroupName - オプション」の指定がなくなりました。
その他
GA版では、 CodeCommitのリポジトリの自動作成はなくなると思っていましたが、現時点ではプレビューと同様に作成されます。この点は、CodeCommitのサービス終了に伴い、将来的には変更になるでしょう。
Amazon Q Developerの一般提供
プレビュー版では、Amazon Q Developerが統合されていましたが、GA版では完全に一般提供されるようになりました。Amazon Q Developerは生成AIを活用した開発支援ツールで、自然言語によるインターフェースを提供し、開発ライフサイクル全体を通じてさまざまな作業を効率化します。GA版では以下の機能が利用可能になりました。
- SQLクエリの作成支援
- ETLジョブの構築支援
- トラブルシューティング機能
- リアルタイムのコード提案
Amazon Bedrockの機能一般提供
プレビュー版では、Amazon Bedrock IDE(旧Amazon Bedrock Studio)がSageMaker Unified Studioに統合されていましたが、GA版ではAmazon Bedrockの一部の機能が一般提供されるようになりました。
- Amazon Bedrock Knowledge Bases
- Amazon Bedrock Guardrails
- Amazon Bedrock Agents
- Amazon Bedrock Flows
統合アーキテクチャとデータアクセス
GA版では、Amazon SageMaker Lakehouseを通じた統一されたデータアクセスとAmazon SageMaker Catalogを通じたガバナンス機能が引き続き提供されています。ユーザーはAmazon S3データレイク、Amazon Redshiftデータウェアハウス、サードパーティやフェデレーションデータソースなど、様々な場所に保存されているデータに統一的にアクセスできます。
その他
プレビューからGA版への移行に伴い、サービスの安定性、パフォーマンス、信頼性も向上されているそうです。プレビュー期間中に収集されたフィードバックに基づいて多くの技術的課題が解決され、エンタープライズグレードのサービスとしての信頼性が提供されています。
最後に
Amazon SageMaker Unified Studioは、データ分析とAI/ML開発を統合した新しい環境として、ついに一般提供が開始されました。データサイエンティストやML開発者がシームレスに作業できるように設計されており、アナリティクス関連サービス(Amazon Athena、Amazon Redshift、AWS Glue、Amazon EMR)、機械学習サービス(SageMaker AI)などの複数のAWSサービスと統合されています。さらに、Amazon Q DeveloperやAmazon Bedrockの機能も同時に一般提供され、データから人工知能開発までの一貫した環境が整いました。組織全体のデータ活用と人工知能開発の効率化が期待されています。
一般提供開始された Amazon SageMaker Unified Studio ですが、今後も引き続き、機能追加や変更が加わることが予想されます。そのため、詳細な設定については、各サービスの画面から引き続き利用する場面も少なくありません。しかし、各サービスの主要な機能を1つに統合することで、データ利活用が捗ることが期待できるでしょう。