[レポート] AWSが考える機械学習トレンドを理解する AI・MLのLeadership Sessionを聴講しました #reinvent #AIM217-L
はじめに
こんちには。
データアナリティクス事業本部 機械学習チームの中村です。
re:Invent 2022に現地で参加し、機械学習系のセッションをメインに回っていました。
本記事では「Innovate with AI/ML to transform your business」というセッションに参加しましたので、そのレポートをします。
セッションについて
- タイトル
- Innovate with AI/ML to transform your business
- 登壇者
- Marco Görgmaier, General Manager, Data Transformation & Artificial Intelligence, BMW Group
- Emad Mostaque, CEO, Stability AI
- Bratin Saha, VP of ML and AI services, AWS
- A.K. Karan, Senior Director - Digital Transformation, Baxter
- Anand Victor, VP Alexa AI, Amazon
- セッション情報
- 日時: 2022-11-30 (Tue) 13:00-14:00
- 形式: Leadership Session
- 番号: AIM217-L
- 会場: Venetian (Level 5, Palazzo Ballroom B, Venetian)
- レベル: 200 - Intermediate
なお、Leadership Sessionはストリーミング配信が同時通訳付きでで視聴できます。
次セッションとの兼ね合いで今回は、ストリーミング配信を視聴しました。
セッション概要
事前の案内としては以下の通りです。
AI/ML can make your business a disruptive innovator in your industry. But, you might encounter barriers to get started and scale AI/ML. In this session, Bratin Saha, VP of AWS AI and ML Services, explains how AWS customers have overcome these barriers by using AWS AI/ML services, fueling business profitability and growth. Bratin also dives deep into the latest trends in AI/ML and how they are enabled by the newly launched AWS capabilities.
(日本語訳)
AI/MLは、あなたのビジネスを業界における破壊的なイノベーターにすることができます。しかし、AI/MLを開始し、スケールさせるための障壁に遭遇することがあります。本セッションでは、AWS AI・MLサービス担当副社長のブラティン・サハが、AWSのお客様がAWS AI・MLサービスを利用してこれらの障壁を克服し、ビジネスの収益性と成長を促進した方法を説明します。また、ブラティンは、AI/MLの最新トレンドと、それらが新しく登場したAWSの機能によってどのように実現されるかを深く掘り下げて説明します。
セッション動画
セッション聴講内容
AWSが提供する機械学習サービス
AI・機械学習サービスは、AWSのデータサービスの全体的なポートフォリオの一部です。
機械学習はいまや56%の企業、10万人以上のカスタマーに利用されている。
AWSでは3つのレイヤで機械学習サービスを提供している。
6つのトレンド
機械学習の方向性を示す6つのトレンドが示されました。
- Model sophistication
- Data growth
- ML industrialization
- ML-powered use cases
- Responsible AI
- ML democratization
Model sophistication
最初のトレンドはモデルの洗練ということで、ここでは主に基盤モデルについての紹介がされました。
その応用例としてCodeWhispererなどのアップデートも紹介されました。
アナウンスとしては以下で、対応するプログラミング言語やIDEが拡がったようです。
詳しくは以下の弊社のブログも参照ください。
また、Stability AIから提供される基盤モデルが、SageMakerから利用可能になった点も紹介されました。
これはアナウンスには見つかりませんでしたが、以下のAWS公式ブログで紹介されています。
ここからStability AIのCEO兼創設者であるEmad Mostaque氏にスピーカが代わります。
Stability AIについて
Stability AIが活動しているコミュニティの紹介がありました(個人的にはなじみが無かったため知れたのは良かったです)。
Stability AIは、最も先進的な基盤モデルを誰でも使えるようにするためのコミュニティを運営しているようです。
最も有名なものとしては、「Stable Diffusion」があります。
先週「Stable Diffusion 2.0」がリリースされ、よりクリーンなデータセットで、高品質で、よりバイアスが少なく高速となっています。
以下のようにほぼ実写のような画像も生成できるようになっているようです。
Depthセンサの信号から、画像データを生成することもできるようですね(これは知らなかった…)
Upscalerなども可能となっています(いわゆる超解像合成でしょうか)。
またさらにこれらを知識蒸留したモデルとして、Distilled Stable Diffusionを本日(11/30)にリリースしています。
より高速により小ステップで画像生成が可能であり、リアルタイムな画像生成を行うことが可能となってきています。
リアルタイムな画像生成のユースケースが想像できなかったのですが、例えばプレゼンしている音声データから、 スライドを自動生成するようなことを考えておられるようでした。
また、Stable Diffusion以外で、GPT-Neo Xというものもコミュニティの成果で、 これは世界で最も人気のある言語モデル基盤で、2,000万回ダウンロードされています。
これを学習するために、AWSのスケーラビリティを利用しました。
AWSのML専用ハードウェアの進化
ここからは、スピーカが元に戻りTrainiumなどのハードウェアの進化についての説明がされました。
これを活用するために、AWSはMetaのAI研究者と協業しているようです。
実は協業は2018年から行っており、例えばTorchServeのリードとメンテナンス、TorchElasticのオープンソース化などで AWSと協業しているようで、最近では、InferentiaやTrainiumなどのAWSの専用MLチップのためのPyTorchの強化に取り組んでいます。 またAWSは、新しいXLAバックエンドをTorchDistributedに寄贈し、よりモデルをTrainiumインスタンスに移行するのを容易にしています。
Data growth
次のトレンドはデータの活用についてです。
SageMakerでは、Ground Truth、Data Wrangler、Studio Notebooksなどにより様々なドメインのデータを活用可能です。
これらの多くは、Who、Whatには答えられますが、WhenやWhereにはまだ答えることができません。 これの「Where」を解決するために、キーノートでも紹介されたGeospatial MLが再度紹介されました。
BMVグループの取り組み事例
このGeospatial MLを活用した取り組みとして、BMVの事例が紹介されました。
具体的にはGPUデータと、経路上のランドマークから、利用しそうなルートを予想し、
それを充電インフラの情報と統合することで、
特定のフリート(車両)がEVに転換する可能性を予測することができました。
Geospatialは以下の特徴を持っています。
- Single API access to disparate data
- 様々な種類のデータに単一のAPIでアクセスできる
- Built-in algorithms to enrich data
- 事前学習済みのセグメンテーションなどのビルトインアルゴリズムがあり、それをデータに適用できる
- Visualizing tools tailored for geospatial data
- 地理空間用にカスタマイズされた可視化ツールがある
これにより、地理空間情報を用いたソリューションをわずか8週間で完成させることができました。
ML industrialization
次は、MLの産業化についでです。
MLの産業化とは機械学習ツールや機械学習インフラを標準化することを指しているようです。 標準化により、カスタマーは開発を自動化し、信頼性と拡張性を高めることが可能です。
AWSでは、SageMakerを利用することで機械学習の開発を標準化することができ、何万ものカスタマーが実際に行っています。 これにより、機械学習プロジェクトの開始までのリードタイムを3ヶ月からわずか1日に短縮することができます。
これはAmazonの中でも同様で、例えばもっとも複雑なAlexaの音声モデルは、SageMakerを使っているようです。
以降は、Alexaの開発者が、ML infrastructureをどのように構成しているかの説明がありました。
その後、SageMaker Studio notebookの次世代機能について紹介がありました。 これは、このセッションの直前にアップデートのアナウンスがあった部分になります。
主に以下の部分について言及されていました。
- Real-time collaboration
- 複数のユーザでの共同作業が可能に
- ソースコードレポジトリと統合され、複数バージョンの管理が簡単に
- experiments, models, artifactsの自動保存
- Automated notebook deployment
- ボタンクリックだけで、Notebookをジョブ化し、コンテナ化して実行、リソース削除までが可能に
詳しくはこちらのAWS公式ブログにも記載されています。
ML-powered use cases
次のトレンドはユースケースに特化したML機能です。
コールセンター向けのTranscribeの活用について述べられ、さらにAmazon Transcribe Call Analyticsの新機能であるリアルタイム分析機能について紹介がありました。
セッションでは以下のような機能に言及されていました。
- 顧客の感情分析をリアルタイムに実施
- 声を荒げる、長期間の沈黙などの検出
- ユーザーフレーズの検出
- 繰り返される「上長と会話したい」や「解約する」など
- 問題を発見したときにコールセンターのスーパーバイザーに通知
弊社のブログでも紹介しておりますので、参考まで。
また別のユースケースとして、Textractを活用した文書処理の自動化について紹介がありました。 事例では、3,000ページのPDFをわずか5分で処理できるようになっているそうです。
さらに住宅ローンの文書に特化した、Amazon Textract Analyze Lendingについて紹介がありました。
こちらも弊社のブログでも紹介しておりますので、参考まで。
さらに次のユースケースとして、製造現場のモニタリングとして Amazon Monitron を紹介されていました。
Monitronを活用している会社として、Baxter社の方がスピーカとして説明されました。
Responsible AI
次のトレンドは、責任のあるAIです。
AWSは、責任にあるAIを以下の6つの要素で考えています。
- Fairness (公平性)
- Explainability (説明可能性)
- Robustness
- Privacy and security
- Covernance
- Transparency (透明性)
これについて、透明性に向けたAWS AI Service Cardsについて紹介がされました。
また、これらを普及するために責任のあるAIに関する教育を実施しています。 公平さとバイアス低減に関する新しいコースをAWSのMachine Learning Universityで開催するようです。
ML democratization
最後のトレンドは、MLの民主化です。ここでは、ノーコードツールであるSageMaker Canvasについて特にフォーカスされていました。
またそれ以外にも教育にも力を入れていることを強調しています。
前述のMachine Learning Universityは無料でコンテンツを展開しています。
最後に
最後に6つのキートレンドの振り返りで締めくくられました。
まとめ
いかがでしたでしょうか。 AWSが考える機械学習トレンドを6つの要点にしぼり、それぞれの直近のアップデートと紐づけられており、 AWSが考える機械学習サービスの姿の全容が分かる良いセッションでした!
機械学習のトレンドを把握しておきたい方は必見のセッションですので、オンデマンド動画の方も是非視聴ください!