Alteryxを使ってクラスメソッドの将来を時系列予測してみた

Alteryxを使ってクラスメソッドの将来を時系列予測してみた

Clock Icon2019.07.05

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データインテグレーション部改めデータアナリティクス事業本部の兼本です。

おかげさまで、クラスメソッドは2019年7月7日で創業15周年を迎えます。

2019年6月30日の夜には、弊社代表取締役社長:横田聡が、これまでのクラスメソッドの歴史を振り返るつぶやきを連投し始め、それを吉田貴文があっという間にTogetterにまとめてしまうという、オープンかつスピード感のある組織で楽しくお仕事しています。

なぜかつぶやきで過去15年間の売上を大公開してましたので、今回はAlteryxを使って雑にクラスメソッドの将来を予測分析してみたいと思います。

まずは売上を予測する

予測分析といえば、やっぱり売上ですよね。(個人の感想です。) Alteryxには時系列予測をするためのツールが用意されていますので、これを使わない手はありません。

まずは15年分の売上を入力データとして用意します。(単位:百万円)

このデータをETS(指数平滑法)ツールとARIMA(自己回帰和分移動平均)ツールに渡して時系列予測を実現することができます。 ワークフローはシンプルにこんな感じ。

パラメータはそれぞれ以下のように設定しています。

  • ETSツールの設定

  • ARIMAツールの設定

気になる予測分析の実行結果について、ETSモデルの場合はプラスとマイナスの両方向に大きくブレる予測になってしまいました。 これは予測の元データが過去15年分と少ないためだと考えられますので、30周年の時にでも再度検証したいと思いますw

一方でARIMAモデルの場合は、2019年度で201億円、オリンピックイヤーとなる2020年度には273億という売上予測になりました。 今回はこれが正しいかどうかを真面目に議論するつもりはないのですが、できるなら予想を超える実績を残したいので、皆様どうかご指導ご鞭撻のほどお願いいたします。 (つまり、お仕事ください)

社員数も大予測!

続いては、今後の社員数を予測しちゃいます。 実は2019年7月時点でクラスメソッド社員は300名を超え、何と大企業の仲間入りを果たしております。 こちらも年度ごとの正確な社員数を調べるのは大変なので、Developers.IOの名物コーナー(?)「クラスメソッドにジョインしました」シリーズの投稿数をカウントすることにします。

ワークフローを簡単に紹介

サイトのフィードを取得して、ジョインブログの記事投稿者と投稿日時を取得します。

フィードは全部で10ページありましたので、反復マクロを使ってページングすることも考えましたが、今回はシンプルに行生成ツールを使って10ページ分のフィードを取得するURLを生成しました。

フィードはXML形式で帰ってくるので、XMLパースツールを使って、XMLデータの解析を行い、投稿者、投稿日時を取得します。

投稿日時のデータは「Thu, 04 Jul 2019 14:40:51 +0000」という書式の文字列データだったのですが、後の工程で年月でグループ化するために、「+0000」という文字列を削除した上で、日時ツールを使って文字列型から日付型にデータ変換し、サマライズツールで投稿年月ごとの投稿者をカウントしています。

データとしては、2013年3月から2019年7月までの66レコード、累計274人分のジョインしましたエントリがありました。 なお、ここには2013年3月以前に入社した社員は含まれておらず、また退社した社員はカウントしていないため、実際の社員数とは異なります。

私が入社した2018年8月はなんと12名の新入社員がおり、ここ1年くらいは毎月数人の新入社員がいる状況が続いていますが、それ以前は新入社員がいない月もありましたので、欠損値を補うために「時系列フィル」ツールを使ってデータのない年月のレコードを生成しておきます。

そして生成したデータをARIMAツールに渡して予測分析したのが、下図です。

2020年6月時点で355名という予測なので、現時点のジョインブログ投稿者数274名から80名くらい増える予測結果となりました。 個人的には今のペースで社員が増えれば、軽く超えていけるんじゃないかと感じていますので、クラスメソッドに興味のある方、どしどし会社説明会にご参加ください。

まとめ

いかがでしたでしょうか。 今回はクラスメソッド創業15周年企画の一環としてAlteyxを使って雑にクラスメソッドの将来を予測してみましたが、Alteryxを使うことでデータの前処理のみならず、時系列分析のようなプレディクティブ処理もまとめて実現できることがお分かりいただけなのではないでしょうか。

最後になりましたが、これらの予測が当たるか否かは、来年気が向いたら検証してみたいと思います。 では。

補足:Alteryxの時系列予測ツールの詳細については、以下のエントリをご参照ください。 - Time Series Forecasting Sample (時系列予測) | Alteryx Predictive Tools 道場 Advent Calendar 2018 #15

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.