[動画公開] データ分析を支える技術 データモデリング再入門 #devio2022
データアナリティクス事業本部のコンサルティングチームの石川です。クラスメソッド主催のオンラインカンファレンス、Developers.IO 2022にて「データ分析を支える技術 データモデリング再入門」というテーマにてセッション動画と資料を公開いたしました。
セッション概要
「仏作って魂入れず」ということわざがありますが、データモデリングせずにDWHという「器」を導入しただけでは、データ分析は捗りません。
データモデリングを考えずに導入したデータ分析基盤は、データマートの乱立、もしくは、データが分かりにくく、分析に手間がかかるため、あまり使われなくなってしまったり、分析に適さないテーブル構造や構成による性能低下、オーバープロビジョニングによるコスト上昇などの問題が考えられます。
DWH(データウェアハウス)のデータモデリングとは何か、代表的なDWHのデータモデリング手法の紹介と、長所・短所、選定のポイントについて解説します。
本セッションでは、DWHのデータモデリングについて新旧一通り網羅するように心がけました。DWHやデータ分析基盤を導入したけど、どのようなテーブル構造や構成にするのが良いか迷っている方に最適なセッションです。
- DWHのデータモデリング
- ビル・インモンさんのDWHのデータモデリング
- ラルフ・キンボールさんのディメンショナルモデリング
- DWHアプローチの選択
- Data Vault モデリング(Data Vault 2.0)
セッション動画(約27分)
セッション資料
最後に
「DWHの父」と呼ばれるビル・インモンさんが提唱したDWH(データウェアハウス)と、その発展に貢献したラフル・キンボールさんが提唱するディメンショナルデータモデリングについて、この2つの長所、短所、選定のポイントについて解説しました。そして、最後に最近よく聞く、データモデリング手法である、Data Vault2.0について紹介しています。分析データの特性や目的を考慮して、データモデリングを適切に選択、実装の役立つことを期待しています。