[レポート] MDS201: AWSからメディア&エンターテイメント業界の最新ニュース #reinvent
はじめに
清水です。AWS re:Invent2019にてセッション MDS201 「Latest Media & Entertainment industry news from AWS」を聴講してきたのでレポートします。
セッションの概要は下記になります。
Learn how the latest AWS services, including media solutions, will help you create content in the cloud, modernize your broadcast and over-the-top distribution, and better engage with your customers. Hear how CBS is using the cloud to automate its media supply chain and deliver streaming at scale to millions of viewers for events like the Super Bowl. And hear how The Guardian is innovating with AI/ML to better engage its readers and build a more inclusive reader community by using Amazon Comprehend and other AI services to moderate user comments at scale.
スピーカーは下記のお三方です。
- Ben Masek - WW BD Head Media & Entertainment, Amazon Web Services
- Mariot Chauvin - Head of Engineering - Digital, Guardian News & Media
- Stephanie Lone - SVP, Engineering, CBS Sports Digital
レポート
メディアソリューションで活用できる最新のAWSサービス
まずはBen Masekさんから、メディアのソリューションで活用できる最新AWSサービスについての紹介、解説がありました。
- AWSでのメディアライフサイクルの革新による完璧なメディアワークロード
- コンテンツ作成とポストプロダクション
- OTTやブロードキャストなどへの配信
- メディアサプライチェーンとアセットマネジメント
- 機械学習と解析
- re:Inventで紹介する(した)お客様の事例
- コンテンツ作成とポストプロダクション
- TURNER
- OTTやブロードキャストなどへの配信
- FOX, HBO, Hotstar, EUROSPORT
- メディアサプライチェーンとアセットマネジメント、 機械学習と解析
- ROCK & ROLL HALL OF FAME
- コンテンツ作成とポストプロダクション
- 新しいAWSのサービスとソリューション
- 最も重要な低レイテンシ
- AWSのサービスとソリューションの強化
- よりスマートなメディアワークフロー
- 詳細とすべてのリストは https://aws.amazon.com/new/reinvet/ から
- そのいくつかを紹介
- AWS Local Zones
- AWSをより多くの場所に拡張する
- メディア系の顧客への利点
- 超低遅延(ultra-low latency)アプリケーションをサポート
- 想定するメディア系ユースケース
- VFXなどのリモートワークステーション
- スイッチングやRT/TXなどのブロードキャストプロダクション
- AWS Local Zone、はじめはロサンゼルスをus-west-2につなげるところからリリース
- AWS Outposts
- AWSのインフラをオンプレで
- メディア系の顧客への利点
- クラウドとオンプレミスの真のハイブリッドエクスペリエンス
- 低レイテンシ、エッジコンピューティング
- 想定するメディア系ユースケース
- VFXやレンダリング、編集などのプロダクション
- スポーツのライブ解析
- 特殊なハードウェアケースでの低遅延サポート
- AWS Wavelength Zones
- 通信事業者からAWSへの5G接続拠点
- メディア系の顧客への利点
- 1桁ミリ秒のレイテンシでのモバイルアプリ配信が可能に
- 想定するメディア系ユースケース
- ニュースやスポーツ、イベント会場での低遅延ライブコントリビューション
- 会場でのエッジコンピューティングによる機械学習推論の実施
- 明日のライブブロードキャストはこのようになる!
- メディアワークフローでのコンピューティング環境の最適化
- AWS Graviton2
- エンコードやレンダリングなどのアプリケーションに
- コストパフォーマンスが40%向上
- Amazon EC2 G4 インスタンス
- NVIDIA T4 GUPの最新版
- リモートグラフィクスワークステーションや動画のトランスコーディングに
- AWS Compute Optimizer
- 最適なEC2インスタンタイプの推奨
- レンダリングやトランスコーディング、ビデオ処理の最適化に
- AWS Graviton2
- グローバルに分散したクリエイティブチーム向けのメディアワークフロー
- ネットワーク
- AWS Global Acceleratorを使ったsite-to-site VPNの機能向上
- AWS Transit Gatewayのクロスリージョンピアリングとマルチキャストサポート
- CloudFrontは37の国、73の都市で210 PoPに
- ストレージ
- Amazon S3のリージョンレプリケーションのタイムコントロール
- AWS DataSyncがさらに5個のリージョンで使用可能に。さらに68%の値下げ
- AWS DataSyncのスケジュールデータ転送
- Amazon EFSがさらに4つのリージョンで使用可能に
- ネットワーク
- ビデオワークフローを完璧にするAWS Media Services
- AWS Elemental Mediaconnect
- RIST(Reliable Internet Stream Transport)のサポート
- AWS Elemental MediaLive
- Statmux output昨日のサポートによるMPTS放送向け配信
- HEVC(High Efficiency Video Coding)がSD、HD、されにUHDに対応
- AWS Elemental MediaConvert
- Dollby Vision HDRサポートとDollby Atomsオーディオ
- 最大25倍のトランスコード高速化
- HEVCでの8k対応
- IMF(Interoperable Master Format)サポート
- AWS Elemental MediaPackage
- ライブ配信のパッケージングくわえファイルベースのパッケージングも対応
- AWS Elemental MediaStore
- chunked object transfer対応
- end-to end OTTの超低遅延(Ultra-low latency)ワークフローに
- AWS Elemental MediaTailor
- ライブ配信のpre-rollでのadインサーションに対応
- AWS Elemental Mediaconnect
- メディアワークロード向けの新しいAWS Media Solutions
- Edit-in-Cloud
- クラウド内の編集用ワークステーションをすぐにspin up
- 編集ファイルはS3バケットのものを直接アクセス可能
- Media2Cloud 2.0 Solution
- サーバレスのend-to-endなコンテンツの取り込み
- リッチメタデータのためにAmazon RekognitionとAmazon Transcribeの利用
- MediaInsight Engine
- メディア解析のためのAWSビルドのリファレンスアーキテクチャ
- 検索やQC、モデレーション、マネタイゼーションをサポート
- 詳細はMedia Solutions(https://aws.amazon.com/media/solutions/)
- Edit-in-Cloud
- 新しいAWS AI/MLサービスによるよりスマートなメディアワークフロー
- Amazon Rekognition Custom Lables
- ドメインに関連すると定義したオブジェクトとシーンの検出
- 独自のロゴ、アイコン、キャラクター、製品などを検出
- Amazon Kendra(preview)
- 非常に正確で使いやすいエンタープライズ検索サービス
- メディア&エンターテイメントの入力と検索に最適化
- Amazon Augmented AI(Amazon A2I)
- 人間がMLの予測をレビューするために必要なワークフローを構築
- コンテンツのモデレート、字幕付与など
- 主な言語拡張として、Amazon Comprehendは6、Amazon Transcribeは15、Amazon Translateは22の言語が追加され、合計は2,804の言語の組み合わせに対応
- Amazon Rekognition Custom Lables
CBS Sports Digitalの事例
続いてStephanie Loneさんから、CBS Sports Digital社での事例の紹介です
- スーパーボールのライブストリーミング(2019/2/3 (sun))
- 同時にストリーミング数百のイベントをストリーミング
- 年間3万以上のライブイベント
- 1日100の同時イベント
- 構想から配信まで5ヶ月
- 85%のコスト削減
- オンデマンドで動的につくられたインフラストラクチャ
- 年間3万以上のライブイベント
- スケールするAWS Elemental MediaLiveの管理
- CBS スポーツ統計ラボ
- 時間あたり数百のベンダーへのフィード
- 分間三千万以上の異なる消費者のメッセージ
- 消費者は品質とスピードに高い期待
- データはベンダー不可知である必要がある
- AWS Data Lab
- AWSトップタレントと1週間の契約
- PoC開発
- バッチプロセスとライブデータ
- データ解析、探索のためのデータレイクの開発
- Amazon SageMakerのようなAIやMLなどの活用
- データエクスペリエンスの強化
- リアルタイムの勝敗予想
- 字幕
- コンテンツ可用性の自動化
- 発見の強化
- Clickerプロジェクトのアーキテクチャ
読者をより良く理解するためのAI/MLの活用
続いて、The Guardian News & Media社のMariot ChauvinさんからAI/MLの活用事例についての紹介です。
- The Guardian digital
- Webサイト
- 13億の月間ページビュー
- 1日あたり10万ユニークユーザ
- アプリ
- 2つのメインアプリ
- 3つのプラットフォーム
- 編集ツール
- 20社の公開ツール
- 解析
- 200個のダッシュボード
- 毎月20万件のクエリ
- 収益
- デジタルアクティビティから55%
- 毎月65万件のサポーター
- 30万回限りの貢献社
- Webサイト
- The Guardian digitalのトランスフォーメーション
- 9ヶ月
- 15のチームで70のアプリケーションをデータセンターでのホスティングからAWSへ移行
- 40,000のデプロイ
- 今年一年で
- 30%の成長
- 3年前にクラウドに移行してからの月間視聴者数
- 25%のコスト削減
- 3年前にクラウドに移行してからの運用サービスコスト
- 9ヶ月
- 課題: コメント数
- 8,000万のコメント
- 5%の訪問者がコメントを読む
- 4.2%がコメント読者のコメント
- 投稿の2%が虐待的であることが判明
- コメントの読者とコメント投稿者は他の人よりも頻繁にサイトを訪問している
- モデレーションツールと選択
- コミュニティの標準
- ディスカッション記事はクローズドに
- ハイリスクな著者などは事前調整を
- 危険なトピックとユーザが報告するスレッド
- モデレータツール
- ビジョンとゴール
- 継続的にオーディエンスを増やしながら、モデレーションのコスト効率を維持する
- 人間の介入無しで悪質なコメントを検出する
- モデレーションチームの作業負荷を軽減する
- 研究論文から
- "Antisocial Behavior in Online Discussion Communities"
- https://cs.stanford.edu/people/jure/pubs/trolls-icwsm15.pdf
- 悪質なユーザの挙動の違い
- リプライが多い
- ポストは少ないスレッドに集中
- ポストと削除数は時間とともに悪化
- 常にではないが多くの場合、過去に削除されたコメントの割合が高い
- "Antisocial Behavior in Online Discussion Communities"
- 機械学習を使用して悪質なコメントを検出する
- 例えば、コメントが不正であるかの判断のため0または1を返すスコア関数を作成する
- Score = (悪質な単語の数) x weight1 + (ユーザによる不正なコメント) x weight2
- コメントが悪質、虐待的である場合はスコアは1
- コメントが問題なければ、スコアは0
- コメントの分類
- 機械学習の5つのステップ
- アンサンブルメソッドの選択
- Random forest分類器
- 相関のない特徴量の選択
- 悪質な言葉
- 大文字
- 十分な大きさの代表的なデータセットを用いてモデルを学習する
- 50万コメント
- 目標までのaccuracy, recall, precisionを評価する
- 十分になるまで繰り返す
- 3回で十分だった
- アンサンブルメソッドの選択
- アーキテクチャ
- 例えば、コメントが不正であるかの判断のため0または1を返すスコア関数を作成する
- 結果
- ワークロードの大幅な削減
- 20%のモデレータのワークロードの初期作業の削減
- 0.29%の検知漏れ(False negative)
- 0.87 AUC、不正コメントを報告する人よりも正確な評価
- ワークロードの大幅な削減
- 次のステップとして
- セグメンテーション
- The Guardianの現在の経験はユーザ向けではない
- 利用可能なデータが有れば、よりよい方法で視聴者をセグメントできる
- 視聴者の理解が深まると、エクスペリエンスをパーソナライズできる
- アーキテクチャ
- Instagramのモデレーション
- Instagramは自傷行為の促進に利用される
- 自殺事件のあと、Instagramはコンテンツをモデレーションすることを宣言した
- 禁止している有効性をどのように監視できるか?
- アーキテクチャ
- Amazon Rekognitionの判定結果をもとにモデレーション
- セグメンテーション
感想
本セッションですが、現地時間2019/12/05(Thu)、16:00-17:00の時間帯に行われたものでした。Dr. Werner VolgesのKeynoteが終わったあと、ということもあり、今年のre:Invent2019を締めくくるのにふさわしい、最新情報満載のセッションだったかと思います。(実際、私個人的にも今年のre:Invent2019最後に聴講したセッションでした。) いわゆるメディア系でいうと今年のre:Invent、新しいサービスは出なかった……、と思いきや、メディアソリューションで活用できるAWS新サービスとしてはたくさんありますね!AWS Local Zones、AWS Outposts、そしてAWS Wavelength Zonesを活用した将来のライブブロードキャスト像はすごいことになりそうです!またメディアソリューション業界でのAWS活用事例としては、AWS Media Servicesを使った事例でも、単純に(1つのチャンネルとして)使うのではなく、スケールすることを考えるなどより複雑なことをしようとしているかと思います。そしてメディアソリューション業界でも機械学習、ML/AIの活用はどんどん広がっていますね。おいてけぼりにならないように今後もキャッチアップしていきたいと思います!