Kaggle 30 Days of MLに参加してみた
はじめに
私が住んでいる札幌では記録的な猛暑になったこの8月でしたが、この1ヶ月の間、8/2からスタートしたKaggleの 30 Days of MLに参加していました。プログラムが終了したので参加した感想などを書いてみたいと思います。
30 Days of MLとは
30 Days of MLは2週間の毎日送られてくるハンズオンに参加してPythonによるデータの前準備やモデルの作成、評価などKaggleに参加するためのスキルと知識を学んだ後、プログラム参加者向けのコンペティションに参加して学んだ内容を試してみる、というプログラムでした。
私は7月ごろからKaggleの初心者向けのコンペのKernelをポツポツと読んで勉強していたのでちょうどいい機会だなと思って参加してみました。
Assignments
Assignmentsは毎日メールで送られてきました。各回テーマが設定されていて、それに関するレッスンとエクササイズに分かれています。レッスンではテーマに関する説明を読みながら実際にコードを実行して結果を確認することができました。エクササイズは学んだ内容に関する穴埋めになっているコードを記述しながら進めるクイズ形式でした。最初の方はPythonの基礎的な内容だったので1日に複数回分消化できたのですが、後半のデータ加工やモデルの作成の方になってくるとエクササイズに1時間以上かかるようなものもありいい練習になりました。
毎日送られてきたAssignmentsは「Assignments」から確認できるので興味がある人はKaggleのアカウントがあれば同じハンズオンを行えます。
Competition
期間の後半のCompetitionは参加者のみが招待されるもので、内容は公開されているコンペのTabular Playground Seriesに非常によく似たものでした。
私のPrivate Leaderboardでのランクは 4730/7573 でした。順位はともかく実施中にコンペに参加したのが初めてだったのでディスカッションや他の参加者のKernelをリアルタイムで読んだりするのが新鮮でした。ただ自分で手を動かしてモデルを改善したりEDAしてみたりにはあまり時間を取れなかったので「やれることはやり切った」というくらいまでコミットしたかったなという思いもあります。
まとめ
コースの内容は既に別のKernelで学んだ内容と重複するものもありましたが夏休みの算数ドリルのごとく毎日のassignmentをこなしていくのはモチベーションとして楽しかったし、コンペでも多くのことが学べました。