【レポート】AWS DeepComposerワークショップに参加してきました #AIM223 #reinvent

本記事は現地時間2019/12/2-6で行われてたre:Invent 2019のセッション「AIM223 AWS DeepComposer: Get started with generative AI」のレポートとなります。
2019.12.04

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちはCX事業本部のさかじです。
本記事は現地時間2019/12/2-6で行われてたre:Invent 2019のセッション「AIM223 AWS DeepComposer: Get started with generative AI」のレポートとなります。

セッション概要

generative AI is one of the most fascinating advancements in artificial intelligence technology, and until now, developers interested in growing skills in this area haven’t had an easy way to get started. In this workshop, you learn about generative AI and get hands-on with AWS DeepComposer, the world's first machine learning–enabled musical keyboard for developers, to create an original composition. You are also introduced to concepts that you can use in Amazon SageMaker to do even more with generative AI. Developers, make some noise!

Generative AIは、人工知能技術における最も魅力的な進歩の1つであり、これまで、この分野でスキルを伸ばすことに興味のある開発者は簡単に始める方法がありませんでした。 このワークショップでは、生成AIについて学び、開発者向けの世界初の機械学習対応の音楽キーボードであるAWS DeepComposerを使って、オリジナルの作曲を作成します。 また、生成SAIをさらに活用するためにAmazon SageMakerで使用できる概念についても紹介します。

スピーカー

  • Jonathan Taws Data Scientist , Amazon Web Services
  • Giulio Soro Sr. Mgr. ML Solutions Lab EMEA , Amazon Web Services

AWS DeepConposerとは

リリースノート

Introducing AWS DeepComposer Posted On: Dec 1, 2019

Developers, press play on machine learning. We are excited to announce the preview of AWS DeepComposer, the world’s first machine learning-enabled keyboard for developers. Get hands-on, literally, with a musical keyboard and the latest machine learning techniques to compose your own music.

With AWS DeepComposer keyboard, you can create a melody that will transform into a completely original song in seconds, all powered by AI. AWS DeepComposer includes tutorials, sample code, and training data that can be used to get started building generative models, all without having to write a single line of code.

Generative AI is one of the biggest advancements in artificial intelligence technology, and until now, developers interested in growing skills in this area haven’t had an easy way to get started. Developers, regardless of their background in ML or music, can get started with Generative Adversarial Networks (GANs). This Generative AI technique pits two different neural networks against each other to produce new and original digital works based on sample inputs. With AWS DeepComposer, you can train and optimize GAN models to create original music.

To learn more and to sign up to the console preview visit the AWS DeepComposer webpage. The AWS DeepComposer keyboard will be available to purchase for $99 in early Q1 2020. Sign up to get notified when it's released. 開発者向けの世界初の機械学習対応キーボードであるAWS DeepComposerのプレビューを発表できることを嬉しく思います。ミュージカルキーボードと最新の機械学習技術を使用して、文字通り、実際に自分の音楽を作ってみましょう。

AWS DeepComposerキーボードを使用すると、数秒で完全にオリジナルの曲に変身するメロディを作成でき、すべてAIを使用できます。 AWS DeepComposerにはチュートリアル、サンプルコード、トレーニングデータが含まれており、これらを使用して、1行のコードを記述することなく、生成モデルの構築を開始できます。

ジェネレーティブAIは人工知能技術における最大の進歩の1つであり、これまで、この分野のスキルの向上に関心のある開発者は簡単に始める方法がありませんでした。開発者は、MLや音楽のバックグラウンドに関係なく、Generative Adversarial Networks(GAN)を使い始めることができます。このジェネレーティブAI技術は、2つの異なるニューラルネットワークを相互に比較し、サンプル入力に基づいて新しいオリジナルのデジタル作品を作成します。 AWS DeepComposerを使用すると、GANモデルをトレーニングおよび最適化して、オリジナルの音楽を作成できます。

コンソールプレビューの詳細とサインアップについては、AWS DeepComposerウェブページにアクセスしてください。 AWS DeepComposerキーボードは、2020年第1四半期初頭に99ドルで購入できます。サインアップして、リリース時に通知を受け取ります。

資料

資料が公開され次第アップデートを予定しています。

Generative AI, Amazon SageMakarで使用できる概念などの説明

資料が公開され次第アップデートを予定しています。

Lab1

  • 手順に沿って あらかじめ用意されているAWSアカウントを使ってAWS DeepComporserのダッシュボードへログイン
  • "Compose music"をクリックして"Music studio"が起動します。

  • すでにきらきら星が入っていました。

  • "▶︎"ボタンを押すと通常の「きらきら星」が再生されます

  • Modelの箇所を"Jazz"を選択、"Generate composition"をクリック数秒で変換が完了します
  • "▶︎"ボタンを押すとJazz調の「きらきら星」が再生されます

  • 次に、AWS DeepComposer keyboardをPCに接続します

  • 赤い"●"をクリックして録音を開始、DeepComposer keyboardから指定の曲を演奏します
    仮想キーボードも使用できます。

  • 録音が完了したら先ほどと同様に好きなModelで"Jazz"を選択して"Generate composition"をクリックして変換します

  • 再生すると自分の演奏した楽曲がJazz調で再生されます

Lab2 GAN モデルの作成

手順に沿って、あらかじめ用意されていたAWS DeepComposer用のJupyter Notebookを操作します。

  • Aamazon SageMakerを開きます
  • "Notebook" - "Notebook instance"を開きます
  • あらかじめ用意されている"deepcomposer-workshop"の"Open Jupyter"をクリック
  • "DeepComposerWorkshop"をクリック
  • "GAN.ipynb"をクリック
  • ”conda_pytbon3"のKernelを選択
  • スクラッチからカスタムGAN作成するnotebookですので一つ一つを"RUN"しています これでオリジナルモデルの作成完了です

参加賞

本ワークショップを受講した方は全員AWS DeepComposerが配られました。弊社で12/11東京から始まるre:Growthでお見せできると思います。

最後に

モデル作成時間で、GANの変換結果がどのように変わるかをデモしていただき、こんなに変わるのか?と驚きました。本当にドキュメント通りに触っただけですので、これから面白いアイデアや使いこなしの事例が出てくると思います。鍵盤を扱うのが記憶にないぐらい昔ですので、そこが一番難しく、今後も難関になるかもしれません。実際鍵盤で入力しても音程よりリズムがきちんとしていないと、気持ちよく再生できる楽曲へ変換はできないと思いました。元データを作る人はある程度音楽の経験が必要かもしれません。