話題の記事

AWS Elemental MediaConvertに高圧縮が可能な最新エンコード規格「AV1」がやってきた!! ので比較動画を作ってみた

2020.03.20

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

おつかれさまです。ゲストブロガーのみうみうです。

AWS Elemental MediaConvert において衝撃的なアップデートがありましたので、検証結果をお伝えします。

後半の方はAV1とか5Gとかを絡めて、なんでこういう技術が大切なのか。という思いを語ります。

AV1がついに使えるように!!

NABの開催に合わせて発表されるのかな、と思っていたAV1の対応ですが、使えるようになっていたので、どれだけのものなのかを検証してみました。

ツイートで気が付く。

これは飛び起きて検証ですね。あんまりリアクションされてないのが不思議ですが...

結論

とりあえず、MediaConvertを使って比較動画を作ってみたのでご覧ください。

AV1/H.265/H.264 の違いを厳密ではないですが、確認することができます。

それぞれのレートは以下の通り。3種類ともQVBRを指定して、50kbps、品質レベルを7に設定してエンコードしました。

bitrate

FinalCutProで読み込めない物に関しては、Mac上で再生したものをQuicktimeで画面収録しております。

特にエンドロールの時の違いがとってもわかりやすいかと思います。いやぁすごい。

なにがすごいの?

今回の比較は「同じビットレートでの品質の差」を見る物でした。

これができるということは、「同じ品質でビットレートが違う」

ということが実現できるということです。AV1の登場でより少ない帯域で今までの映像を流すことが可能になるわけです。

これは後述するインターネットの中立性にまで関わってくる壮大な話だと思っています。

どうやったらいいの?

実際のやり方は以下をご確認ください。

いくらかかるの?

とっても高いです。個人のアカウントでやってるので怖いです。 今回はSDの素材を10分くらいの動画をエンコードしましたが、1本で1000円くらいです。変換に掛かった時間は100分くらい。

機械学習的な探索をフレーム間でやりながらエンコードしているらしい(どっかで聞いたけど曖昧)なので、かなりのリソースを使います。クラウド時代が前提となって策定されている規格ともいえます。

日本語ページに記載がなかったので、英語ページでご確認ください

AV1とは

動画圧縮技術のひとつです。エンコード。ENC。

動画はエンコードで圧縮をしてアーカイブなり送信なりを行い、再生時にデコードを行い解凍して映像を再生することができます。

2020年現在はMPEGのH.265(HEVC) やGoogleのVP9あたりが主流ですAV1は次期のエンコードとして策定進んでいます、

ちなみに、AV1とぱっと見 似てますが、AVI(えーぶいあい)は動画のファイルフォーマット(コンテナ形式)を指しますが、AV1(えーぶいわん)は動画のエンコード形式を指します。

誰がやっているの

Alliance for Open Media という団体が開発を進めています。AO Mediaと略します。AV1は「AO Media Video 1」の略です。

2018年時点でのメンバーは以下の通り。そうそうたるメンバーです。

  • Amazon
  • Cisco
  • Google
  • Intel
  • Microsoft
  • Mozilla
  • Netflix
  • ARM
  • NVIDIA
  • Facebook
  • Apple

この内、Netfilx・Google・Amazon・Facebook・Microsoft・Appleの6社だけで、インターネットトラフィックの43%以上を使用している、と言われています。動画はその中でも多くを占めているということは想像に難くないと思います。

SANDVINE

AV1が必要とされている2つの理由

これから時代、動画をエンコードするタイミングが爆発的に増えてきます。そこで以下の問題が懸念されます。

  • ライセンス・パテント料の問題
  • インターネットトラフィックの問題

背景として、

第5世代移動通信システムである5Gがいよいよ2020年に日本でもサービス開始されます。帯域も太くなり高速な通信が可能になります。場所を選ばない無線通信によって通信をするためのハードルは下がってきます。

「多接続性」という特徴もあるため今までインターネットに繋がってなかった機器がこれまで以上に接続される。ということが考えられます。

例えばカメラ。監視カメラなどはもちろんですが、この度のCOVID-19 感染拡大に伴って多くのイベントが中止になりました。そして、その代替として大多数の人数がzoomなどを用いてネット上に集まっています。これらは今までにないトラフィック負荷を生んでいます。在宅率が上がることでネットワークの使用率は上がっていきます

ビデオストリームを意識しよう

すでにNetflixは欧州での感染拡大を受けて「HDは不必要だよね?」って言い始めています。

IoT機器が増えていくにつれ、様々なデータがインターネット越しにやり取りされるようになり、ビッグデータと言われるようになりました。いまはまだテキストデータがメインですが、画像や動画のデータの割合はどんどん増えてきます。

ライセンスの問題

MPEGはパテントを管理している団体 MPEG LA がパテントを一括管理しています。HEVCだと1 unitあたり$ 0.2をライセンスとして支払う必要があります。これが上記の大企業にするとそれなりのインパクトとなるため、多くのエンジニアを抱える企業たちが「自分たちで作って、管理していこうぜ。」となるのは不可避な流れなのかもしれません。

Hw265(HEVC)のパテント料について

ネットワーク帯域のお話

こっちのネットワークの問題の方が個人的には大変だと思っています。ユーザー1人1人に大きく関わってくるからです。上記にもある通り、これからネットワークの使用帯域はどんどん増えていきます。

よく「5Gになったらテレビ放送の電波塔をやめ、5Gに乗せ替えればよいのではないか」という議論になります。

これについては以前、Tech-in AWS#番外編でのLTで触れさせていただきましたが、いまの放送で使っているエンコード方式(MPEG2-TS)で乗り換えようとすると、ざっくり計算で 354 Tbps のトラフィックが発生します。地上波HD画質だけで。

(とっても雑な計算なのでツッコミお待ちしておりますw)

「これってインターネットに乗るんでしたっけ?」というお話をしっかりしていかなければなりません。もちろん、テレビに限ったお話だけではありません。

その解決方法の1つが「画質はそのままで、データ量を下げる」新しいエンコード方式が検討されていて、その最有力がAV1というわけです。トラフィックの大半を占める動画についてなんとかしよう。というわけです。

AWS Local ZonesAWS WaveLength のAWS新サービスは低レイテンシーが必要なもののために、と言われています。しかし、別の側面として「いかにインターネットトラフィックを減らすか」という点で非常に有効なサービスだと思っています。閉域網とかMECはすごい大切。

サービス提供側が「こんなの俺には関係ないわー」ってやっていると、最終的にはインターネットの中立性が揺らぐことにもなりかねません。数年前から総務省では議論が進んでいます。

最後に

なんか長くなってしまった。

エンジニアにとって「なぜこの技術を学ぶのか。それは世界的な視点で、どう影響しているのか」というのは個人的にすごく興味があるところなので、またご紹介できればと思います。