クラスメソッド データアナリティクス通信(機械学習編) – 2024年2月号

2024年1月分のAWSおよびGoogle Cloudの機械学習関連サービスのアップデート情報をお届けします。
2024.02.02

データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。

クラスメソッド データアナリティクス通信(機械学習編) の2024年2月号です。2024年1月分のアップデート情報をお届けできればと思います。

はじめに

AWSでは、Amazon SageMaker Feature Storeのプロビジョンド型キャパシティモードの提供がありました。Amazon RekognitionのコンテンツモデレーションもAPIが更新され、なんの理由で不適切とされたのか分かるようになり、さらに使いやすくなったと思います。

Google Cloudでは、BigQueryのベクトルサーチ機能のプレビュー提供はとても嬉しいニュースでした。Google Cloud Next ’23でロードマップとなっていた機能だと思いますが、早速プレビューで利用できるので、ぜひ使ってみて今後リリースに備えたいなと思います。Vertex AI Workbenchのノートブックの変更については以前からあるユーザー管理のノートブックとマネージドノートブックを使われている方は、新しいVertex AI Workbenchインスタンスを使うことを検討した方が良いアナウンスがありましたので見て頂くと良いと思います。

それでは各々のアップデートを振り返って行ければと思います。

※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。

AWS

Amazon SageMakerのアップデート

Feature Storeがプロビジョンド型キャパシティモードを提供開始

オンラインストアの読み取りおよび書き込みのキャパシティについてプロビジョニングが可能になりました。特徴量グループレベルで、プロビジョンド型モードとオンデマンドモードを切り替えることもできるようです。

ML推論でM7i・C7i・R7iインスタンスのサポート開始

リアルタイムおよび非同期の推論でM7i・C7i・R7iインスタンスのサポートを開始しました。リージョンは米国西部(オレゴン)をはじめとする6リージョンで東京リージョンは未対応です。

モデルチューニングで削除用APIをサポート

DeleteHyperParameterTuningJob APIを使用して、ListHyperParameterTuningJob APIのレスポンスに表示したくないチューニングジョブを削除し、チューニングジョブ名を再利用できるようになりました。

削除にはsagemaker:DeleteHyperParameterTuningJobIAMアクションへの許可が必要です。

APIのアップデート

上記変更に関するAPI変更に加え、APIリクエストのバリデーションに関する変更がありました。

Amazon Rekognition

APIのアップデート

DetectModerationLabelsおよびGetMediaAnalysisJobAPIのレスポンスにContentTypeTaxonomyLevelが追加されました。これにより、検出した特定の内容の不適切コンテンツのみフィルタするということが可能になるようです。

Google Cloud

Vertex AI

Automatic side-by-side(AutoSxS)のプレビュー提供が開始

2つの大規模言語モデル(LLM)を比較するモデル支援型評価ツールであるAutoSxSのプレビュー提供がアナウンスされていました。Vertex AI Model Registry内の生成AIモデルと、事前に生成された予測のパフォーマンスを評価できるそうです。

textembedding-geckoモデルのGAとファインチューニング

textembedding-geckoモデルとtextembedding-gecko-multilingualモデルがGAになりました。また、textembedding-geckoモデルに対しては教師ありファインチューニングを実施できるようになりました。

Vertex AI Workbenchのノートブックの変更について

Vertex AI Workbenchのうち、ユーザー管理のノートブックとマネージドノートブックの廃止がアナウンスされました。2025/1/30に新しいインスタンスを作成することができなくなるようです。以降も元々あるインスタンスは残るものの、パッチ適用などはされなくなるとのことでした。

少し先のことではありますが、今後は2023/9に一般提供開始された新しいVertex AI Workbenchインスタンスを使うのが良さそうです。

プレビュー版ですが、移行用のツールの紹介がありましたのでリンクを記載します。

Speech-to-Text

モデルの追加について

Universal large Speech Model(USM)アーキテクチャに基づいた、録音された電話の音声に有効なモデルが公開されました。

また、13の言語でlatest_longモデルの利用が可能になりました。latest_shortモデルについても、その品質が大幅に改善されました。

BigQuery ML

ML.EXPLAIN_FORECAST関数の出力に残差が追加

ARIMA_PLUSモデルおよびARIMA_PLUS_XREGモデルについて、ML.EXPLAIN_FORECAST関数の出力に新しくresidualカラムが追加されました。正解の時系列と推定した時系列の差分を出力します。

ベクトルサーチ機能がプレビュー提供

類似のベクトルを計算するためのVECTOR_SEARCH関数や、テーブルにベクトルインデックスを作成するCREATE VECTOR INDEXがプレビュー提供で追加されました。

Google Cloud Next ’23でロードマップとなっていた機能かなと思います。

既にBigQueryに保存したテキストを元に、PaLM2を使ってベクトルを生成できるため、組み合わせると強力です。LLMを活用したシステムでもさらにBigQueryを中心とした設計が可能になりますね。

イベント・サービス情報

相談会

クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。

このようなことでお困りではないですか?

企業内に点在するデータを1箇所にまとめて分析したい クラウド上で分析基盤を導入したい・・・ データを活用したいが、具体的に何から始めたらいいかわからない 機械学習相談会のお申込みはこちらです。お気軽にご相談ください。

データ分析相談会のお申込みはこちらです。

機械学習システム導入支援サービスについて

AWSやGoogle Cloudなどパブリッククラウドにて、機械学習サービスを活用したシステムの導入支援を行います。詳しくは以下のページをご覧ください。

例えば以下のようなケースをご支援しています。

  • ECサイトのレコメンドシステムを構築し、利用者にパーソナライズされたおすすめ商品を提示する
  • SNSや問い合わせのログなどから、テキストマイニングを活用したインサイトの発見する
  • 画像解析により、工場における不良品検出や農業・畜産業分野での生育管理を効率化する
  • 売上や消費者の行動などから、将来の需要を予測する

最後に

2024年1月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。

データアナリティクス通信(機械学習編) - 2024年2月号は以上です。