DeepRacer同好会 第二回オフライン勉強会@大阪で行動・報酬関数に関するセッションをしました

日本人からDeepRacer Leagueチャンピオンを
2019.05.17

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

もはやDeepRacerの人になりつつある、DI部の貞松です。
レースのタイムは据え置きです、とても辛い。

去る2019年5月16日に開催されたDeepRacer同好会 第二回オフライン勉強会@大阪に参加しました。

DeepRacer同好会 第二回オフライン勉強会@大阪 -connpass

当社DI部の大澤から、東京でやったオフライン勉強会を大阪でもやるんでなんか話しませんか?という誘いを受け、二つ返事で参加を決めました。 付け焼き刃で内部実装的なことに踏み込むよりも、実際にDeepRacerの学習モデル作成〜レース参加を行って得られた情報を共有する感じが良いだろうと思い 「最適な行動・報酬関数を得る為の試行錯誤」というタイトルで発表させていただきました。
(内部実装的なことは大澤が話してくれるので安心・安全です)

セッションスライド

AWS DeepRacerで最適な行動・報酬関数を得る為の試行錯誤

2019/05/16 DeepRacer同好会 第二回オフライン勉強会@大阪 のセッションスライドです。

セッションに関する所感と当日の雰囲気

まずは前置きを。今回は当社AIソリューション部のせーのが旗振りだったこともあり、 会場はクラスメソッド大阪オフィスでスピーカーは全員クラスメソッド社員でしたが、あくまで有志の同好会(クラスメソッドが会社として主催しているわけでは無い)なので 今後は所属や地域に関わらず色々な領域の方で勉強会・セッションを盛り立てていただけると嬉しいです。

当日のセッション内容としては、

  • せーの:DeepRacer Leagueの大会レギュレーションとモデル開発からレース参加までの簡単な流れ
  • 貞松:DeepRacerコンソールを用いた開発の流れから、行動の設定、報酬関数の設計に関する注意点や実際にやってみて得られたアイデアを幾つか
  • 大澤:機械学習・強化学習の基礎的な話からDeepRacerで使われている強化学習アルゴリズムの話まで

という流れで、どんどん内部に潜り込んでいく、まさにDeepDive的な内容でとても良い構成だったように思います。 セッション中も一方的なプレゼンテーションでなく、途中で質疑応答・ディスカッションが活発に行われ、想定より時間が押すほどの盛り上がりでした。

また、飛び入りLTも発生するなど、皆さん手の内を隠さず、出来るだけ情報共有しながら切磋琢磨しようという姿勢が素晴らしかったです。 日本人からチャンピオンを輩出する!という同好会の主旨にそぐわぬ、オールジャパンで世界と戦う雰囲気を感じました。

今後の活動について

まずは各々現在開催中のVirtual CircuitおよびAWS Summit Tokyoで開催されるDeepRacer Leagueに集中することになります。 できれば6月中旬に岡山でもオフライン勉強会を開催できれば…と画策しています。乞うご期待。