クラスメソッド データアナリティクス通信(機械学習編) – 2024年6月号

2024年5月分のAWSおよびGoogle Cloudの機械学習関連サービスのアップデート情報をお届けします。
2024.06.05

データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。

クラスメソッド データアナリティクス通信(機械学習編) の2024年6月号です。2024年5月分のアップデート情報をお届けできればと思います。

はじめに

AWSでは、Amazon Personalizeで新たなレシピUser-Personalization-v2とPersonalized-Ranking-v2が使えるようになった点が個人的に大きなアップデートでした。モデルのアーキテクチャが新しくなり、精度の向上や推論速度のアップがされました。

以下のブログでも詳細に取り上げています。

Google Cloudでは、Vertex AI SearchでチェックグラウンディングAPIが一般提供開始されました。これにより、生成された回答に対して、事実のチェックが必要な項目を特定することができるようになり、より正しい回答が生成できるようになると期待できます。

それでは各々のアップデートを振り返って行ければと思います。

※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。

AWSのアップデート

Amazon Transcribeのアップデート

生成AIを活用した通話要約が一般提供開始

コンタクトセンターとのやり取り向けに、顧客が通話した理由・問題への対処方法・フォローアップアクションなどの主要な要素を含む簡潔な通話の要約を生成することができるようになりました。

現在英語でのサポートで、バージニア北部とオレゴンで利用できます。

Amazon Personalizeのアップデート

大型のアイテムカタログを低レイテンシーでサポートする新しいレシピをリリース

User-Personalization-v2とPersonalized-Ranking-v2のレシピが発表されました。

アーキテクチャがトランスフォーマーベースとなり、最大500万のアイテムが格納されたカタログをサポートするようになり、推論のレイテンシーも低くなりました。

テストにおいては、以前のバージョンと比較して、レコメンデーションの精度が最大9%向上し、レコメンデーションの対象範囲が最大1.8倍拡大したということで、小さいコストでより良いレコメンド生成ができるようになったのはとても良いなと思いました。

冒頭のブログでも詳細に取り上げています。

データセットからのユーザーの削除がより簡単に

新しい削除APIを使用して、Personalizeのデータセットからユーザーを削除できるようになりました。ユーザーメタデータやユーザーインタラクションともに削除できるようなので、ユーザーからの個人情報の削除依頼があった場合に心配せずともこのAPIを使えばよく、このアップデートも大変良いですね。

Amazon SageMakerのアップデート

DataZoneでMLワークフローのデータガバナンスがサポート

Amazon DataZoneでMLアセットの管理ができるようになりました。

SageMaker Canvasの起動が最大10倍速く

既存または新規のSageMakerドメインで作成されたすべての新規ユーザープロファイルで、Canvasが高速起動するようになったようです。

Amazon Bedrockのアップデート

新しいモデルが利用可能に

以下のモデルが利用できるようになりました。

  • Amazon Titan Text Embeddings V2
  • Amazon Titan Text Premier
  • Mistral Small

ナレッジベースがベクトルストレージとしてMongoDB Atlasのサポートを開始

ナレッジベースのベクトルストレージとしてMongoDB Atlasがサポートされました。

Amazon Bedrock Studioのプレビューが開始

Amazon Bedrock Studioで組織全体の開発者が共同して生成AIアプリケーションを構築できるようになりました。

以下で使用例も紹介されているので興味がある方はご確認ください。

ナレッジベースで推論パラメータの設定が可能に

ランダム性や多様性(top-p)、出力の長さ(MaxTokens・stopsequence)などの推論パラメータを指定できるようになりました。

エージェントがプロビジョンドスループットをサポート

特定のベースモデルのモデルユニットを購入することで、1分あたりに処理される入力トークンまたは出力トークンの最大数によって測定される特定の保証スループットを提供するようになりました。契約期間なし・1 か月・6か月の契約期間を選択できるようです。

Amazon Pollyのアップデート

新生成エンジンがリリース

2つのアメリカ英語音声(Ruth・Matthew)、1つのイギリス英語音声(Amy)が追加されました。

Google Cloudのアップデート

Vertex AIのアップデート

Ray on Vertex AIが一般提供開始に

機械学習ワークフローのための分散コンピューティングと並列処理のインフラストラクチャを提供するRay on Vertex AIが一般提供を開始しました。

現状、Rayバージョン2.9.3とPython 3.10がサポートされています。Supported versions of Ray on Vertex AIでサポートされたバージョンが確認できます。カスタムイメージとカスタムサービスアカウントを使用できます。

Vertex AI Agent Builderのアップデート

Vertex AI Searchでチェックグラウンディングが一般提供開始に

チェックグラウンディングAPIが一般提供開始しました。

これにより、生成された回答に対して、事実のチェックが必要な項目を特定することができるようになりました。

根拠となるテキストをファクトとして渡し、それらに対してどの程度根拠があるかを示すサポートスコアを受け取ることができます。

Generative AI on Vertex AIのアップデート

新しいモデルの追加

  • Gemini 1.5 Flash(gemini-1.5-flash-preview-0514)がプレビューで提供開始しました。
  • PaliGemmaモデルが提供開始しました。
  • Gemini向け(Gemini 1.0 Pro・Gemini 1.5 Pro・Gemini 1.5 Flash)のバッチ推論が提供開始しました。
  • text-embedding-004とtext-multilingual-embedding-002が一般提供開始しました。
  • Model Gardenで以下が利用可能に
    • E5: GPUまたはCPUで動作するテキストエンベディングモデル
    • Instant ID
    • Stable Diffusion XL lightning

BigQueryのアップデート

Gemini Pro向けのリモートモデルが一般提供開始に

以下の生成AIに対するリモートモデルをML.GENERATE_TEXTで使う機能が一般提供開始しました。

  • Vertex AI gemini-1.0-proとgemini-1.0-pro-vision
  • Vertex AI gemini-1.5-pro

Text-to-Speechのアップデート

Journey音声が追加

自然な会話音声であるJourney音声にen-us-Journey-Oが追加されました。

イベント・サービス情報

ウェビナー

5/15に開催された『Classmethod Showcase 事例で学ぶ、データ活用戦略の最新動向』に登壇しました。

AI/MLのよくあるユースケースとレコメンデーションの効果的な活用戦略についてご紹介しました。

登壇した内容については、以下のブログ記事でもご紹介しております。

相談会

クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。

このようなことでお困りではないですか?

企業内に点在するデータを1箇所にまとめて分析したい クラウド上で分析基盤を導入したい・・・ データを活用したいが、具体的に何から始めたらいいかわからない 機械学習相談会のお申込みはこちらです。お気軽にご相談ください。

データ分析相談会のお申込みはこちらです。

機械学習システム導入支援サービスについて

AWSやGoogle Cloudなどパブリッククラウドにて、機械学習サービスを活用したシステムの導入支援を行います。詳しくは以下のページをご覧ください。

例えば以下のようなケースをご支援しています。

  • ECサイトのレコメンドシステムを構築し、利用者にパーソナライズされたおすすめ商品を提示する
  • SNSや問い合わせのログなどから、テキストマイニングを活用したインサイトの発見する
  • 画像解析により、工場における不良品検出や農業・畜産業分野での生育管理を効率化する
  • 売上や消費者の行動などから、将来の需要を予測する

最後に

2024年5月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。

データアナリティクス通信(機械学習編) - 2024年6月号は以上です。