クラスメソッド データアナリティクス通信(機械学習編) – 2023年9月号

2023年8月分のAWSおよびGoogle Cloudの機械学習関連サービスのアップデート情報をお届けします。
2023.09.19

データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。

クラスメソッド データアナリティクス通信(機械学習編) の2023年9月号です。2023年8月分のアップデート情報をお届けできればと思います。

はじめに

AWSでは、エンドポイント更新オプションの追加やモデルカードのクロスアカウント共有のサポートなどがあり、SageMakerがより広いユースケースに対応したことが伺えました。SageMaker Distribution Dockerイメージにより、ローカル環境・Studioノートブック・SageMakerトレーニングジョブで同じランタイムを使用できるようにもなりました。

Google Cloudでは、Google Cloud Next '23でのアップデートが多数ありました。特に印象的だったのはPaLM2の多言語対応の一般提供開始で、これにより日本語テキストに対してPaLM2が利用可能になりました。

それでは各々のアップデートを振り返って行ければと思います。

※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。

AWS

Amazon SageMakerのアップデート

SageMaker Profilerが一部リージョンでプレビュー提供を開始

SageMaker Profilerが米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド) でプレビュー提供開始になりました。モデルのトレーニングのパフォーマンスを最適化するため、コンピューティングに使用するハードウェアのプロファイリング結果を確認できるようになるようです。リソース使用率のようなボトルネックをSageMaker Profilerで確認して改善を図ることができるようになるのでとても便利そうですね。

エンドポイント更新オプションにローリングデプロイが追加

SageMakerエンドポイントのデプロイで、ブルー/グリーンデプロイに加えてローリングデプロイが利用できるようになりました。

トレーニングジョブでml.p5インスタンスのサポートを開始

大規模言語モデルや拡散モデルのような訓練ジョブの中でも最も厳しい要件に対応するためのインスタンスファミリーであるP5インスタンスがSageMakerトレーニングジョブで利用可能になりました。

モデルカードのクロスアカウント共有をサポート

AWS RAMを通してモデルカードをAWSアカウント間で共有できるようになりました。モデルカード共有を一元的に管理するアカウントを作成することで、ガバナンスをより強固にすることも可能です。

SageMaker Distribution Dockerイメージの発表

ローカル環境・Studioノートブック・SageMakerトレーニングジョブで同じランタイムを使用し、シームレスな移行を実現するためのSageMaker Distribution Dockerイメージが発表されました。

SageMaker Studioでも利用可能ということで、東京リージョンで確認してみましたが、ブログの通りイメージを利用可能な状態となっていました。

Dockerイメージの選択

Amazon SageMaker Studio Labでも利用可能とのことです。

SageMaker Data Wranglerの各種サービスへのアクセスの強化

SageMaker Data Wranglerでデータソースへのアクセス強化のアナウンスが複数でていました。

まず、Salesforce Data Cloudです。SageMaker Data Wranglerを使うことで、S3などへのETLパイプラインの準備なしに、SageMakerで直接Salesforce Data Cloud内のデータを利用できます。

次に、S3アクセスポイントのサポートです。S3アクセスポイントでは、単一のバケットポリシーを管理する代わりに、アクセスポイントに特定ユースケースの個別のポリシーを使用し、よりきめ細やかなアクセス制御を実現できます。

3点目として、データソースとしてAmazon EMRを使用する際に、ロールによるアクセス制御ができるようになりました。

APIのアップデート

p5.48xlargeインスタンスを利用できるようになったことによるアップデートに加え、多くの更新がありました。

Amazon Pollyのアップデート

2つのボイスが追加

湾岸アラビア語男性の音声であるZaydと、ベルギーフランス語女性の音声であるIsabelleが利用可能になりました。

APIのアップデートも上記の新規音声に関連するものとなっています。

Google Cloud

Google Cloud Next '23でのアップデート

会期である8/29から8/31の間に、多くのAI/MLサービスのアップデートが発表されました。こちらについては以下のブログにまとめております。

以降は、Google Cloud Next '23以外で発表されたアップデートについて記載します。

Vertex AIのアップデート

Vertex AI Pipelinesのスケジュール実行機能が一般提供開始になりました。

Imagenのマルチモーダルなembedding機能が一般提供開始になりました。

Vector Searchのパブリックエンドポイントが一般提供開始になりました。

カスタムトレーニングのためのpersistent resourceがプレビューになりました。長期間稼働するマシンクラスターを確保することで、訓練ジョブ実行時にマシンをプロビジョニングする待ちを省くことができるようです。

BigQuery MLのアップデート

推論機能として以下がサポートされました。

  • ONNXおよびTensorflow Liteのモデルと、XGBoostのモデルをインポートして推論に使えるように
  • ML.PREDICTから、Vertex AI Predictionのエンドポイントを指定してリモートモデルを使用できるように
  • Vertex AIの事前学習済みモデルを使って推論が可能に

イベント・サービス情報

相談会

クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。

このようなことでお困りではないですか?

企業内に点在するデータを1箇所にまとめて分析したい クラウド上で分析基盤を導入したい・・・ データを活用したいが、具体的に何から始めたらいいかわからない 機械学習相談会のお申込みはこちらです。お気軽にご相談ください。

データ分析相談会のお申込みはこちらです。

機械学習システム導入支援サービスについて

AWSやGoogle Cloudなどパブリッククラウドにて、機械学習サービスを活用したシステムの導入支援を行います。詳しくは以下のページをご覧ください。

例えば以下のようなケースをご支援しています。

  • ECサイトのレコメンドシステムを構築し、利用者にパーソナライズされたおすすめ商品を提示する
  • SNSや問い合わせのログなどから、テキストマイニングを活用したインサイトの発見する
  • 画像解析により、工場における不良品検出や農業・畜産業分野での生育管理を効率化する
  • 売上や消費者の行動などから、将来の需要を予測する

最後に

2023年8月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。

データアナリティクス通信(機械学習編) - 2023年9月号は以上です。