データウェアハウス再入門
4月入社の川崎です。Redshiftに取り組むにあたり、改めてデータウェアハウス(DWH)の基本について確認しておこうと思います。
DBA(データベース管理者)歴20年の私の経験から言えるのは「同じデータベースでも、データウェアハウスはOLTP系とはまったく違う」ということです。ところが、DWHの教科書みたいな書籍が日本語ではほとんど無いので、書籍の代わりにSlideshareなどネット上のリソースを中心に検索してみます。
「10年戦えるデータ分析入門」青木峰郎 著 http://www.sbcr.jp/products/4797376272.html
著者はクックパッドの方で、元テラデータ出身のようです。(どうりでDWHに詳しい訳ですね)ネットの書評によると「分析の本ではなく分析のためのSQLの入門書」だそうですが、この「分析のためのSQL」が仕事の役に立ちそうな気がしています。(対象データベースは、RedshiftではなくてPostgresqlになっています)
著者の青木さんの、Slideshare上のスライドがとても参考になります。 http://www.slideshare.net/mineroaoki/presentations
Amazon Redshiftによるリアルタイム分析サービスの構築
Cookpad TechConf 2016 - DWHに必要なこと
巨大なバッチを分割して構成する 〜SQLバッチフレームワークBricolage〜 http://techlife.cookpad.com/entry/2015/06/27/154407 → DWHがっつり経験者の視点が、すごく参考になります。
データベース徹底攻略 (WEB+DB PRESS plus) → 特集5「Redshift徹底活用」青木峰郎 著 http://www.amazon.co.jp/dp/4774163651
本日は以上ですが、後日自分でもまとめてみたいと思います。データウェアハウスについての社内勉強会をやりたいなと考える今日この頃です。
それでは、また。
【追記】
Inmon先生のスライドを発見。タイトルは「DATA WAREHOUSE BASICS」。昨年来日されてたんですね。