AWS re:Invent2013参加レポート #30 Lumberjacking on AWS: Cutting Through Logs to Find What Matters

2013.11.18

「AWSの木こり」(元ネタはUOでしょうか?)をモチーフに、ログの解析手法をまとめたセッションでした。スライドの概要をレポートします。

2013-11-15 11.31.04

まずはジョークのスライド。「未来では、未来が予測できるようになっているかもね」という感じでしょうか。

2013-11-15 11.31.30

予測できなかったこととして、コンピュータシステムのコストや性能の比率があります。線形ではなく、指数関数的に増減が見られるメトリックがあり、適切な投資や対応が難しいものもありました。

2013-11-15 11.31.522013-11-15 11.32.49

それらの解決方法として、しばしば人海戦術が取られます。例はかつての産業革命、工業の場合ですが、コンピュータシステムでも同様のことが言えます。例えば、FourSqueare。サービスの利用者が地道に地理情報を登録することで成り立つシステムと言えます。
ログの解析はどうでしょうか。CloudFrontのログを示してみます。

2013-11-15 11.38.42

これを解析するにはどうする方法があるでしょうか。例えば、R言語による解析があると思います。大量のメモリが必要であれば、EC2で実行するのもよいでしょう。

2013-11-15 11.39.17 2013-11-15 11.40.41 2013-11-15 11.40.55

効率よく解析を行うのであれば、他のデータの解析と同様、データウェアハウスを利用するのがよいでしょう。アーキテクチャ図の例を示します。

2013-11-15 11.41.39 2013-11-15 11.42.18

ログの送信

2013-11-15 11.43.42

では、ログを送信するにはどのような方法があるでしょうか。CloudFrontのログはS3に保存されます。ただ、そのままだと解析するには勝手がよくないと思います。

2013-11-15 11.44.21

2013-11-15 11.44.49

2013-11-15 11.45.08

たとえば、Fluentd。(柔軟性やスケーラビリティなど絶賛していました)

2013-11-15 11.45.54

そして、新サービスのAmazon Kinesis。

2013-11-15 11.46.53

ログの集約

ここでは、Amazon ElasticMapReduce(EMR)のS3Distcpを例に挙げます。

2013-11-15 11.49.14

2013-11-15 11.49.26 2013-11-15 11.50.13

それから、Pigの活用。

2013-11-15 11.51.32 2013-11-15 11.52.12

Pigの監視について

2013-11-15 11.53.00

2013-11-15 11.53.35

EMRの最適化も重要です。CloudWatchのEMRに関するメトリクスを監視しましょう。

2013-11-15 11.55.06

2013-11-15 11.56.18

2013-11-15 11.56.32

EMRの監視は、他の製品を使うこともできます。Management ConsoleのオプションでGangliaを選択している例です。

2013-11-15 11.56.59

パートナーのツールを利用することもできます。EMR Monitoringの例。

2013-11-15 11.58.26

また、EMRクラスタノードには、スポットインスタンスを利用するのも良いでしょう。

2013-11-15 11.59.20 2013-11-15 12.00.08 2013-11-15 12.00.32

ここで、ジェフベゾスの有名なフロー図を、データ解析になぞらえて紹介。2枚目のTrafficとsellersが変わっていますね。

2013-11-15 12.01.35

2013-11-15 12.03.00

ログの解析

ここからは、解析の話へ。RedShiftが出てきました。

2013-11-15 12.04.03-1

2013-11-15 12.04.32

データのインポート方法。COPY文の実行、もしくはDataPipelineを利用します。

2013-11-15 12.04.46

2013-11-15 12.06.40

解析結果の可視化。タブローでの例。

2013-11-15 12.07.17 2013-11-15 12.08.27

可視化するツールは複数あります。Rの例を示します。

2013-11-15 12.09.18 2013-11-15 12.10.28

それから、クラスタは利用するときのみ起動するようにすることで、費用を押さえることができます。スナップショットを活用しましょう。

2013-11-15 12.11.50

2013-11-15 12.12.12

2013-11-15 12.12.54

まとめ

紹介してきたログ解析の構成を改めて示します。

2013-11-15 12.13.16

ログ解析以外の用途はどうでしょうか。例えばA/Bテストでも同様の手法が利用できます。

2013-11-15 12.14.41

最後に知っておいていただきたいのは、統計・解析は必ずしも正しい結論を出してくれるとは限らない、ということです。エイブラバム・ウォールド博士の例を示しておきます。

2013-11-15 12.15.30

2013-11-15 12.16.00

2013-11-15 12.16.37