#cmdevio2016 (レポート: C-1) データ分析チームの振り返りについて話しました
2016年2月20日に開催したDevelopers.IO 2016で「データ分析チームの振り返り」というタイトルでお話をさせて頂きました。当日は雨天の中ご来場いただきありがとうございました。
スライド
テーマ
「去年の自分たちに伝えたいこと」というテーマで、統計や機械学習に興味を持っている、もしくは取り組み始めたばかりの方を対象に、データ分析チームでの約1年の学びを共有することを目的としてお話しました。幸い、当日の参加者の方も想定通りの方にご参加いただけたようで、少しでも参加者の方のお役に立てれば幸いです。
概要
基本的な内容は普通の開発案件とデータ分析というか機械学習案件の違いについて話しました。私自身はデータ分析チームが出来るまでは普通の開発案件しか経験がなかったので、データ分析系の案件をやってみる中で、今までに経験した普通の開発案件との違いについてまとめたいと以前から考えていました。やはり一番の違いは仕様書通りに作っても完成しないという所かと考えます。正確には仕様書を作れないことがあると言った方が適切かもしれません。やってみないと分からないという所が、普通の開発案件との違いかと考えます。
もちろん、通常のシステム開発でも現場で利用されなかったり、Webサービスやアプリであれば想定通りの売上が立たないこともあるので、ビジネスとして成功するかどうかという意味ではやってみないと分からないのは同じだったりはするかとは考えます。あと、参加者の方から質問をもらいましたが、成果が出ないと言っても、何も残らないのではなく、そのデータについてその期間とメンバーで取り組んでも成果が出ないということは分かりますし、分析結果や今後の方向性についてはレポートとして残るはずです。そもそも成果が出ることが分かっているならば分析する必要が無いわけで、やってみないと分からないので、期間と予算を決めて試してみるという部分はどうしても必要になるという認識に至りました。ですので、なるべく短期間かつ低コストにできるノウハウを貯めて、何度もチャレンジできるようにしていくことが求められると考えています。
あとは初めて統計や機械学習に触れた際につまずいた点やどうやって学んでいくと良いかという点についてまとめてみました。高度な内容は書籍やスライド、ブログ等が大量に存在するので、初心者が最初に疑問に思うのではないかなという点についてまとめてみたつもりです。この辺りは個人差があるところだとは思いますが、参考になれば幸いです。
まとめ
他にも色々と実際に案件をやる中で気がついたことはあるので、また別の機会もしくは弊社ブログで共有できればと考えています。