クラスメソッド データアナリティクス通信(機械学習編) – 2024年3月号

2024年2月分のAWSおよびGoogle Cloudの機械学習関連サービスのアップデート情報をお届けします。
2024.03.04

データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。

クラスメソッド データアナリティクス通信(機械学習編) の2024年3月号です。2024年2月分のアップデート情報をお届けできればと思います。

はじめに

AWSでは、S3 Express One Zoneを使ったAmazon SageMakerのモデルトレーニング高速化の一般提供開始がアナウンスされました。またAmazon Rekognitionで新しいモデレーションラベルが追加され、より精度高く利用できるようになったことも嬉しいお知らせでした。

Google Cloudでは、なんといってもVertex AI Geminiの一般提供開始が目玉だったと思います。これに合わせてBigQuery MLからも利用ができるようになりました。また、BigQuery MLからVertex AI PaLM2 APIへエンべディングを依頼するためのML.GENERATE_EMBEDDING関数の一般提供開始も大きなポイントでした。これによりBigQueryでSQLのみでテキストのエンべディングからベクトルの類似度検索・テキスト生成までできるようになりました。

それでは各々のアップデートを振り返って行ければと思います。

※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。

AWS

Amazon SageMakerのアップデート

S3 Express One Zoneを使ったモデルトレーニング高速化

Amazon S3 Express One Zoneストレージクラスを使って、トレーニングデータ・チェックポイント・モデルの入出力時間を短縮し、Amazon SageMakerモデルトレーニングを高速化できるようになったそうです。

APIのアップデート

SageMaker HyperPodに関するAPIの追加がありました。

Amazon EC2のアップデート

Capacity Blocks for MLでサポートするインスタンスおよびリージョンの拡張

以下のインスタンス・リージョンが追加で利用できるようになりました。

  • P5インスタンス:米国東部 (バージニア北部) リージョン
  • P4dインスタンス:米国東部 (オハイオ) ・米国西部 (オレゴン) リージョン

Amazon Rekognitionのアップデート

新しいモデレーションラベルを追加

モデルに26の新しいモデレーションラベルが追加され、モデレーションラベルの分類も2層から3層に拡張されたことで画像に対するコンテンツモデレーションの精度が向上しました。

アニメーションやイラスト付きのコンテンツを識別する新しい機能も導入されたそうです。

Amazon Bedrockのアップデート

マネジメントコンソールのUIが新しく

マネジメントコンソールのデザインが刷新され、よりモダンで使いやすくなりました。

Amazon Pollyのアップデート

トルコ語の女性音声NTTSであるBurcuが追加

トルコ語向けに初めてのNTTSが追加されました。

APIのアップデート

Burcu追加によるAPIのアップデートがありました。

Google Cloud

Vertex AIのアップデート

Vector Searchがのコンソールがより使いやすく

コンソールから、インデックスおよびエンドポイントの作成・エンドポイントへのインデックスの配置・最近傍のインデックスの照会ができるようになったようです。

Model Gardenへのモデル追加

以下の8つが追加になりました。

  • Stable Diffusion XL LCM
  • LLaVA 1.5
  • PyTorch-ZipNeRF
  • LLaMA 2 (Quantized)
  • WizardLM
  • WizardCoder
  • AutoGluon
  • Lama (Large mask inpainting)

また、ワンクリックのチューニングボタンや20以上のモデルに対する事前訓練済みのOSSアーティファクトデプロイボタンの追加や、各種モデル向けのノートブックの追加もありました。

ビデオ向けのマルチモーダルエンべディングが一般提供開始

multimodalembeddingモデルによるビデオ向けのマルチモーダルエンべディングが一般提供開始しました。

Vertex AI Geminiが一般提供開始

Vertex AI Gemini 1.0 ProおよびGemini 1.0 Pro Visionマルチモーダルモデルが一般提供開始しました。

europe-west1europe-west2europe-west3europe-west4europe-west9のリージョンでも利用できるようになりました。

Gemmaモデルが一般提供開始

Geminiモデルに基づく軽量の生成人工知能(AI)オープンモデルのセットであるGemmaモデルも一般提供開始しました。

BigQueryのアップデート

リモートモデルでGeminiが利用可能に

Vertex AI Gemini向けの連携機能が一般提供開始しました。

ML.GENERATE_TEXT関数でgemini-proが指定できるようになりました。

また、BigQuery DataFramesでもbigframes.ml.llmモジュールのGeminiTextGeneratorクラスを使うことでVertex AI Geminiに問い合わせをすることができるようです。

ML.GENERATE_EMBEDDING関数が一般提供開始

Vertex AI textembedding-gecko*テキストエンべディングモデルにリクエストを実行するためのML.GENERATE_EMBEDDING関数が一般提供開始しました。

これでBigQuery MLの組み込みの機能のみでテキストエンべディングができるようになりました。

ちょうど先日関連するイベント登壇をしたのでとても嬉しいです。

時系列分析用の関数がプレビューで追加

時系列分析用のtime-series関数とrange関数がプレビューで提供を開始しました。

Text-to-Speechのアップデート

スタジオボイスのGAとカジュアルボイスのプレビュー提供開始

スタジオボイスが一般提供開始しました。 カジュアルボイスがプレビュー版で提供開始しました。

カジュアルボイスではより流暢で自然な雰囲気の音声が出力されるようです。

イベント・サービス情報

相談会

クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。

このようなことでお困りではないですか?

企業内に点在するデータを1箇所にまとめて分析したい クラウド上で分析基盤を導入したい・・・ データを活用したいが、具体的に何から始めたらいいかわからない 機械学習相談会のお申込みはこちらです。お気軽にご相談ください。

データ分析相談会のお申込みはこちらです。

機械学習システム導入支援サービスについて

AWSやGoogle Cloudなどパブリッククラウドにて、機械学習サービスを活用したシステムの導入支援を行います。詳しくは以下のページをご覧ください。

例えば以下のようなケースをご支援しています。

  • ECサイトのレコメンドシステムを構築し、利用者にパーソナライズされたおすすめ商品を提示する
  • SNSや問い合わせのログなどから、テキストマイニングを活用したインサイトの発見する
  • 画像解析により、工場における不良品検出や農業・畜産業分野での生育管理を効率化する
  • 売上や消費者の行動などから、将来の需要を予測する

最後に

2024年2月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。

データアナリティクス通信(機械学習編) - 2024年3月号は以上です。