クラスメソッド データアナリティクス通信(機械学習編) – 2023年2月号

2023.02.06

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データアナリティクス事業本部の鈴木です。

クラスメソッド データアナリティクス通信(機械学習編) の2023年2月号です。2023年1月分のアップデート情報をお届けできればと思います。

先月は、AWSではAmazon Personalizeにて、直近の傾向を考慮できるレシピやインポート済みのデータセットの分析機能が追加され、非常に便利になりました。

Google Cloudでは、BigQuery MLとVertex AIの統合がさらに進み、BigQuery MLを使った機械学習機能の開発をより強力にサポートしようとしていることを実感する月でした。

それでは各々のアップデートを振り返って行ければと思います。

※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。

AWS

Amazon Personalizeのアップデート

新レシピ「Trending Now」が追加されました。この機能により、ユーザー間で急速に人気を集めているアイテムを推薦できるようになります。ユーザーの最新インタラクションデータを元に、30分・1時間・3時間・1日ごとにおすすめアイテムを更新するオプションが用意されています。既存のカスタムデータセットグループにTrending Nowソリューションを作成することも可能です。細かい頻度で再学習しなくても、この機能で自動的に直近の変化を反映してくれるのはとても便利そうです。

また、IAMポリシーにおけるタグのサポートも発表されました。タグに基づいて、リソースと操作へのアクセスをきめ細かく制御することが可能になります。タグに基づいたアクセス制御については、DevelopersIOの『AWSのABAC(タグに基づいたアクセス制御)の設計/運用のポイントを考える』の記事もぜひ併せてご確認下さい。

さらに、インポート済みのデータセットに対してワンタッチで分析を実行する機能が追加になりました。分析を実行することで、簡単にデータセットの統計情報や洞察と、それに対する推奨の改善案を得ることができます。現在のデータセットを改善し、より良いレコメンデーションを実行するためにはどうすればいいか、手軽に手がかりが得られるようになりました。

この機能について、DevelopersIOで記事を公開しているのでご確認下さい。

Amazon SageMakerのアップデート

自動モデルチューニングでチューニングジョブで、対応するトレーニングジョブに環境変数を渡すことができるようになりました。以前はSageMakerトレーニングジョブのみ使える機能でしたが、CreateTuningJob APIでもランタイム環境変数を柔軟に指定できるようになりました。

また、プライベートDockerレジストリにあるコンテナイメージでSageMakerトレーニングジョブを実行できるようにAPIがアップデートされました。

利用できるモデルも追加されています。まず、Cohere社の事前学習済み言語生成モデルを使用可能になりました。質問応答・コピーライティング・言い換えなどで、高速な応答が必要なタスクに優れたモデルです。

さらにJumpStartのStable Diffusionモデルで、画像をアップスケールできる新機能も発表されました。低解像度だったりぼやけていたりする画像を、より滑らかで鮮明に見える高解像度画像に変換することができます。

Amazon Kendraのアップデート

セルフマネージド型OpenSearch向けのAmazon Kendraインテリジェントランキングを発表しました。MLの専門知識がなくても、OpenSearchの検索結果の品質を迅速に向上させることができます。

また、4つのコネクタが追加されました。

Amazon Pollyのアップデート

NTTS(neural Text-to-speech)の5種類の男性ボイスを新しくリリースしました。Sergio(カスティーリャ語)、Andrés(メキシコ語)、Rémi(フランス語)、Adriano(イタリア語)、Thiago(ブラジルポルトガル語)です。

Google Cloud

システムに関する観点では、BigQuery MLとVertex AI Model Registryの統合がGAになりました。Vertex AI Model RegistryにBigQuery MLモデルを登録し、1つのインターフェースを使用して、モデルのバージョン管理・評価ができるようになります。また、BigQuery MLモデルをVertex AI Model RegistryからVertex Deploymentのエンドポイントに直接デプロイできます。

Google Cloud Pipelineコンポーネントに、20以上のBigQuery MLコンポーネントが一般提供開始になりました。Google Cloud Pipeline Components listのBigQuery ML componentsで一覧を確認できます。よりBigQueryをMLパイプラインに組み込みやすくなりますね。

手法については、BigQuery MLがARIMA_PLUS_XREGモデルによる多変量時系列予測をサポートしました。

入力や前処理に関する観点では、まずBigQuery MLモデルトレーニングにおけるスパースなデータを入力できるようになりました。

プレビューですが、BigQuery MLに以下の関数が追加されました。いくつかのスケーラとOneHotエンコードが追加されています。

ほかにも、小売業向けの新たなAIツールが発表されています。

イベント情報

クラスメソッドで開催している機械学習・データ活用に関するイベント情報です。

相談会

クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。

このようなことでお困りではないですか?

  • 企業内に点在するデータを1箇所にまとめて分析したい
  • クラウド上で分析基盤を導入したい・・・
  • データを活用したいが、具体的に何から始めたらいいかわからない

機械学習相談会のお申込みはこちらです。お気軽にご相談ください。

データ分析相談会のお申込みはこちらです。

最後に

2023年1月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。

AWSではAmazon Personalizeからデータの異常を検知するための機能が追加されたのが、個人的にとても嬉しいアップデートでした。より大きなシステムなら現在プレビューのAWS Glue Data Qualityでデータの品質に関するチェックがかけられますが、Amazon Personalizeだけを主に使われている方でも簡単に同様なチェックができ、加えてAmazon Personalizeならではの推奨事項を教えてもらえるのはとても便利だと思います。

Google Cloudでは、新しく追加されたBigQuery MLコンポーネントをぜひ使ってみたいと思います。BigQuery MLとVertex AIを合わせて使える機能が続々と追加されており、これらの機能を使ってどのように、より簡単かつ強力に機械学習機能を構築できるかについて検証し、ご提案していければと思います。

データアナリティクス通信(機械学習編) - 2023年2月号は以上です。