クラスメソッド データアナリティクス通信(機械学習編) – 2023年10月号
データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。
クラスメソッド データアナリティクス通信(機械学習編) の2023年10月号です。2023年9月分のアップデート情報をお届けできればと思います。
はじめに
AWSでは、基盤モデル(FM)をAPIを通じて利用できるようにする完全マネージド型サービスであるAmazon Bedrockがついに一般提供開始しました。AWSでは7月にアナウンスされたAuroraのpgvectorサポートなど生成系AI利用のための様々なアップデートがありましたが、Bedrockの一般提供開で生成系AIを使ったシステム開発がより強力に支援されるようになりました。
Google Cloudでは、Vertex AI Workbenchインスタンスが一般提供開始し、機械学習向けの開発環境がより使いやすくなりましたね。
それでは各々のアップデートを振り返って行ければと思います。
※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。
AWS
Amazon SageMakerのアップデート
リアルタイム推論で応答ストリーミングをサポート
SageMakerリアルタイム推論からクライアント側に推論応答をストリーミングできるようになりました。チャットボットなど推論の一部を継続的に返すことでクライアント側の満足度が向上するようなユースケースで重要になりそうです。
SageMaker CanvasでJDBCによるデータコネクタを追加でサポート
SageMaker CanvasでSalesforce・Databricks・SQL Server・MySQL・PostgreSQL・MariaDB・Amazon RDS・Amazon Aurora用の8つの新しいJDBCコネクタをサポートしました。Canvasでより多くのデータソースから柔軟にデータを取り込み、機械学習モデルを開発することができますね。
PyTorch向けのマルチモデルエンドポイントの推論をサポート
SageMakerマルチモデルエンドポイント(MME)でPyTorch(TorchServeを使用してデプロイされたもの)をサポートしました。
デフォルトのプリセットによるStudioのクイックセットアップ方法を開始
デフォルトのプリセット(SMFullAccess ロール・IAM・パブリックインターネット専用モードなど)を使用して、数回のクリックでSageMaker Studioのプロファイルを作成できるようになりました。
具体例については、以下の記事で紹介されています。
Model Monitorでモニタリングジョブのオンデマンド実行が可能に
モニタリングジョブをオンデマンドで実行し、機械学習モデルやデータのパフォーマンスを柔軟に取得できるようになりました。トラブルシューティングしたいときなどに役立ちますね。
地理空間機能がノートブック向けにGPUインスタンスを新たにサポート
SageMaker Studioで地理空間機能を使う際にGPUインスタンスを使用できるようになったようです。この機能は米国西部(オレゴン)リージョンで一般提供されています。
APIのアップデート
Model Monitorでの、モニタリングジョブのオンデマンド実行に関するAPIアップデートに加え、いくつかのアップデートがありました。
- 2023/09/05 - Amazon SageMaker Service - 1 updated api methods
- 2023/09/08 - Amazon SageMaker Service - 2 updated api methods
- 2023/09/15 - Amazon SageMaker Service - 3 updated api methods
- 2023/09/19 - Amazon SageMaker Service - 12 updated api methods
Amazon Personalizeのアップデート
一部データセットでより多くのカラムが利用可能に
カスタムパーソナライゼーションモデルのトレーニングに使用するデータセットについて、以下のようにより多くのカラムを使用できるようになりました。
- アイテムデータセットで100列(2倍)
- ユーザーデータセットで25列(5倍)
Amazon Lookout for Equipmentのアップデート
ML産業機器モニタリングサービスであるAmazon Lookout for Equipmentで、既存のMLモデルを再トレーニングできるようになりました。モデルを削除して再構築することなく、定期的なモデルの再トレーニングをスケジュールするようなことも可能となり、より使いやすくなりました。
Amazon Bedrockのアップデート
Bedrockが一般提供開始
ついにBedrockが一般提供開始しました。BedrockはAmazon Titanといった基盤モデル(FM)をAPIを通じて利用できるようにする完全マネージド型サービスです。コンソールからはPlayGroundsで様々なFMを利用することができます。もちろんBoto3など各種SDKを使い、プログラムからの利用も可能です。
東京リージョンでも使用可能です。
#Amazon Bedrockの記事一覧ページで続々と記事を公開していますのでご覧ください。
Titan Embeddingsが一般提供開始
Amazon BedrockからAmazon Titan Embeddingsを使用することでテキスト検索に最適化されたテキストの埋め込み表現を取得することが可能になりました。
Google Cloud
Vertex AIのアップデート
一部リージョンでA2 Ultraマシンタイプが利用可能に
マシンタイプごとに固定数のNVIDIA A100 80GB GPUがアタッチされているVMを使い、推論を行うことができます。
Vertex AI Workbenchインスタンスが一般提供開始
マネージドノートブックとユーザー管理のノートブックが統合されたような機能のようです。
BigQuery MLのアップデート
ポイントインタイム検索のための関数がプレビューに
時系列モデルについて訓練・推論するために、ポイントインタイム検索を行うためのML.FEATURES_AT_TIME関数およびML.ENTITY_FEATURES_AT_TIME関数がプレビューにて利用できるようになりました。
イベント・サービス情報
相談会
クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。
このようなことでお困りではないですか?
企業内に点在するデータを1箇所にまとめて分析したい クラウド上で分析基盤を導入したい・・・ データを活用したいが、具体的に何から始めたらいいかわからない 機械学習相談会のお申込みはこちらです。お気軽にご相談ください。
データ分析相談会のお申込みはこちらです。
機械学習システム導入支援サービスについて
AWSやGoogle Cloudなどパブリッククラウドにて、機械学習サービスを活用したシステムの導入支援を行います。詳しくは以下のページをご覧ください。
例えば以下のようなケースをご支援しています。
- ECサイトのレコメンドシステムを構築し、利用者にパーソナライズされたおすすめ商品を提示する
- SNSや問い合わせのログなどから、テキストマイニングを活用したインサイトの発見する
- 画像解析により、工場における不良品検出や農業・畜産業分野での生育管理を効率化する
- 売上や消費者の行動などから、将来の需要を予測する
最後に
2023年9月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。
データアナリティクス通信(機械学習編) - 2023年10月号は以上です。