アドベントカレンダー企画で参照したモダンデータスタック(MDS)のカテゴリと「DAMA DMBOK v2」で紹介されているトピックのマッピングを試みてみた

2023.12.30

アライアンス事業部 エンジニアグループ モダンデータスタック(MDS)チームのしんやです。

今月(2023年12月)、自身2年ぶり6度目のひとりアドベントカレンダー企画で「モダンデータスタック」に関するシリーズにチャレンジし、無事完走しました(通常企画としては25日で終わるのですが、企画内容的に30個あったので25日を超えて30日分やりました)。記事一覧はこちらをご参照ください。

データ周りの世界に於いては、データマネジメント協会(DAMA)が編纂したデータマネジメントに関する知識体系としてDMBOK(データマネジメントの知識体系)というものが存在します。2017年に DAMA Internationalによって刊行され、データ専門家のためのリファレンスガイドとして位置づけられています。ナレッジワーカー、プロジェクトマネージャー、経営幹部、技術スタッフ、データアナリスト、データアーキテクト等など、データに関係するあらゆる人々が参考にすべき情報がこのガイドにはまとまっています。

DMBOKに関しては日本語に関する情報もあり、DMBOKに関する書籍も『データマネジメント知識体系ガイド 第二版』として2018年に刊行されています。個人的にも購入しています(ですががまだ触り程度しか読み進められてはいません...)。

DMBOKの現行最新版であるDMBOK2では、『DAMA Wheel(DAMAホイール図)』というものが定義されています。これはデータマネジメントにおけるデータガバナンス、及びデータガバナンスを実現するためのデータ管理活動に関するトピック10個の計11個の知識領域を図示化したものです。DMBOK2ではこのDAMAホイール図の他にもデータ倫理、ビッグデータ、データの統合と相互運用性、データ管理の成熟度評価という4つの専用セクションについても言及、展開しています。

モダンデータスタックのカテゴリを一通り眺めてみた、そしてこのDMBOKのDAMAホイール図を眺めてみて『そういえばこのDAMAホイール図+αのトピック群に、今回MDSアドベントカレンダーで見てきたカテゴリをマッピングしてみたらどうなるんだろう?』と思い立って試してみたのが当エントリの内容となります。全部が全部、スッキリと整理マッピング出来るのかという疑問もありますが、とりあえずチャレンジしてみたいと思います。

目次

 

DMBOK2で展開されている11+4のトピック

まずはベースとなるDMBOKの情報から。書籍『データマネジメント知識体系ガイド 第二版』ではDAMAホイール図に展開されている11個のトピック(3〜13章)と4つの専門セクション(14〜17章)の基本的な情報を書籍から抜き出して引用してみます。「説明」欄の罫線上半分はそのトピックにおける概要説明、罫線下半分は章における「ツール」(そのトピックで扱うツールやサービスの特性や特徴に関するものにはどのようなものがあるか)の見出しレベルの情報(を抜き出したもの)になります。そのトピックに関するサービスはどんなものが該当するのか?の指針になる情報ですね。

 

DAMAホイール図に展開されている11個のトピック

トピック 説明 書籍該当章
データガバナンス 企業のニーズを考慮し、データにまつわる意思決定権の体系を確立し、それによってデータマネジメントの方向性を決め、監督する
--------------------
・オンラインでの存在感
・業務用語集
・ワークフローツール
・文書管理ツール
・データガバナンス・スコアカード
第3章
データアーキテクチャ データ資産管理のブループリント、つまり青写真を定義すること。アーキテクチャは組織戦略に沿った、戦略的データ要件と、その設計(デザイン)を確立する
--------------------
・データモデリングツール
・資産管理ソフトウェア
・グラフィックデザイン・アプリケーション
第4章
データモデリングとデザイン データモデルという明確な形式でデータの要件を洗い出し、分析し、表現し、伝達するプロセス
--------------------
・データモデリング・ツール
・リネージツール
・データプロファイリング・ツール
・メタデータリポジトリ
・データモデル・パターン
・業務データモデル
第5章
データストレージとオペレーション データの価値を最大化するため、保存データを設計、実装、サポートすること。データ計画の立案からデータ廃棄に至るまでのデータライフサイクルを通して実施される
--------------------
データモデリングツール
データベース監視ツール
データベース管理ツール
開発者サポートツール
第6章
データセキュリティ データのプライバシーと機密性を保ち、データを侵害から守り、適切なアクセスを確保する
--------------------
・ウィルス対策ソフトウェア/セキュリティソフトウェア
・HTTPS
・アイデンティティ管理技術
・侵入検知と防止ソフトウェア
・ファイアウォール(予防)
・メタデータの追跡
・データマスキング/暗号化
第7章
データ統合と相互運用性 データストア、アプリケーション、組織などの内部またはその間を移動し、統合されるデータに関するプロセス
--------------------
・データ変換エンジン/ETLツール
・データ仮想化サーバ
・エンタープライズ・サービスバス
・業務ルールエンジン
・データとプロセスのモデリングツール
・データプロファイリング・ツール
・メタデータリポジトリ
第8章
ドキュメントとコンテンツ管理 非構造(構造を持たない多種多様な)メディア、特に法律や規制に準拠するために必要な文書など、そこに含まれるデータやインフォメーションのライフサイクル管理のための計画、実装、統制アクティビティ
--------------------
・エンタープライズコンテンツ管理システム
(ECM: Enterprise Contents Management)
 ・ドキュメント管理
 ・コンテンツ管理システム
 ・コンテンツとドキュメントワークフロー
・コラボレーションツール
・統制語彙とメタデータツール
・標準マークアップと交換フォーマット
・eディスカバリ技術
第9章
参照データとマスターデータ 最も正確で、鮮度が高く、関連が深い事実が、重要な業務エンティティに対してシステム間で一貫し取り扱われるように、重要な共有データを継続的に照合・保守する方法
--------------------
・マスタデータ管理(MDM)
 ・データ統合ツール
 ・データ修復ツール
 ・オペレーショナルデータストア(ODS)
 ・データ共有ハブ(DSH)
 ・MDM専用アプリケーション
第10章
データウェアハウジングとビジネスインテリジェンス 意思決定を支えるデータを管理し、ナレッジワーカーがデータ分析やレポートを通じてデータから価値を得られるようにすること。そのための計画、実装、統制プロセス
--------------------
・メタデータリポジトリ
 ・データ辞書/用語集
 ・データとデータモデルのリネージ
・データ統合ツール
・BIツール
 ・オペレーショナルレポーティング
 ・ビジネスパフォーマンスマネジメント
 ・オペレーショナルアナリティック・アプリケーション
第11章
メタデータ 高品質で統合されたメタデータをアクセス可能にするための計画、実装、統制のアクティビティ。メタデータには定義、モデル、データフロー、その他様々な情報が含まれる。これらはすべて、データを理解するため、またデータを生成・保守・アクセスするシステムを理解するために重要である
--------------------
・メタデータリポジトリ管理ツール
第12章
データ品質 組織内で利用されるデータの適性を測定し、評価し、改善するための品質管理技術の計画と遂行
--------------------
・データプロファイリング・ツール
・データクエリツール
・モデリングとETLツール
・データ品質ルールテンプレート
・メタデータリポジトリ
第13章

 

その他4つの専門セクション

トピック 説明 書籍該当章
ビッグデータとデータサイエンス 大規模かつ多様なデータセットを収集し分析する能力を強化するために必要となる技術と業務プロセスを説明する
--------------------
・MPPシェアードナッシング・テクノロジとアーキテクチャ
・分散ファイルベースのデータベース
・データベース内アルゴリズム
・ビッグデータクラウドソリューション
・統計計算とグラフィック言語
・データ視覚化ツール
第14章
データマネジメント成熟度アセスメント 組織のデータマネジメント力を評価し強化するための取り組みの概要を説明する
--------------------
・データマネジメント成熟度フレームワーク
・コミュニケーション計画
・コラボレーションツール
・ナレッジマネジメントとメタデータリポジトリ
第15章
データマネジメント組織と役割期待 データマネジメントチームを編成し、データマネジメント業務を成功させるためのベストプラクティスと考慮すべき事項を提供する 第16章
データマネジメントと組織の変革 効果的なデータマネジメント業務を組織内に定着させるため、組織文化の改革が必要であり、その計画立案方法と困難を切り抜ける方法を説明する 第17章

 

MDSカテゴリとDMBOKトピックのマッピング

そしてここからが当エントリの本題。「紹介したMDSのカテゴリはDMBOK2のトピックのどこに当てはまるのか(または当てはまらないのか)。若干「ここかな?(エイヤー)」で当てはめてみた部分もあるのでマッピング的に怪しい部分もあるかなと思うので「それはちげーよ、定義するならここだろ」みたいな御指摘があれば是非頂けますと幸いです。

 

対データホイール図の11トピックス

本当は横に15個並べたかったんですがDevelopersIOにおける横幅制限の制約上、11+αに分ける形で進めます。「その他」については11個トピック以外のもの(専用セクション4つを含む)に該当してそうな場合に◯を付けています。

MDSカテゴリ

DMBOKカテゴリ
データガバナンス データアーキテクチャ データモデリングとデザイン データストレージとオペレーション データセキュリティ データ統合と相互運用性 ドキュメントとコンテンツ管理 参照データとマスターデータ データウェアハウジングとビジネスインテリジェンス メタデータ データ品質 その他
#01:ETL Tools(ETLツール)
#02:Data Workspace/Collaboration(データワークスペース/コラボレーション)
#03:Data Modelling and Transformation(データモデリング&データ変換)
#04:Data Warehouses(データウェアハウス)
#05:Feature Store(フィーチャーストア)
#06:Event Tracking(イベントトラッキング)
#07:Metrics Store(メトリックストア)
#08:Business Intelligence(BI)
#09:No code automation(ノーコード自動化)
#10: Augmented Analytics(拡張分析)
#11: Operational Analytics(運用分析)
#12:Data Cataloging(データカタログ)
#13:Synthetic Data(合成データ)
#14:Data Privacy and Governance(データプライバシーとガバナンス)
#15: Spreadsheet based BI(スプレッドシートベースのBI)
#16: Reverse ETL Tools(リバースETLツール)
#17:Data Lakes(データレイク)
#18: 『Workflow Orchestration(ワークフローオーケストレーション)
#19:Data Discovery(データディスカバリー)
#20:Business Reliability/Observability(ビジネスの信頼性/観察可能性)
#21:Data Quality Monitoring(データ品質監視)
#22:Data Streaming(データストリーミング)
#23:PLG CRM(Product-led growth CRM)
#24: Change Data Capture(変更データキャプチャ)
#25: Data Mesh(データメッシュ)
#26:Managed Data Stack(マネージドデータスタック)
#27:Product Analytics(プロダクト分析)
#28:Customer Data Platform(CDP)
#29:DataOps(データオプス)
#30:Data Apps(データアプリケーション)

 

対その他4つの専門セクション

MDSカテゴリ

DMBOKカテゴリ
ビッグデータとデータサイエンス データマネジメント成熟度アセスメント データマネジメント組織と役割期待 データマネジメントと組織の変革
#01:ETL Tools(ETLツール)
#02:Data Workspace/Collaboration(データワークスペース/コラボレーション)
#03:Data Modelling and Transformation(データモデリング&データ変換)
#04:Data Warehouses(データウェアハウス)
#05:Feature Store(フィーチャーストア)
#06:Event Tracking(イベントトラッキング)
#07:Metrics Store(メトリックストア)
#08:Business Intelligence(BI)
#09:No code automation(ノーコード自動化)
#10: Augmented Analytics(拡張分析)
#11: Operational Analytics(運用分析)
#12:Data Cataloging(データカタログ)
#13:Synthetic Data(合成データ)
#14:Data Privacy and Governance(データプライバシーとガバナンス)
#15: Spreadsheet based BI(スプレッドシートベースのBI)
#16: Reverse ETL Tools(リバースETLツール)
#17:Data Lakes(データレイク)
#18: 『Workflow Orchestration(ワークフローオーケストレーション)
#19:Data Discovery(データディスカバリー)
#20:Business Reliability/Observability(ビジネスの信頼性/観察可能性)
#21:Data Quality Monitoring(データ品質監視)
#22:Data Streaming(データストリーミング)
#23:PLG CRM(Product-led growth CRM)
#24: Change Data Capture(変更データキャプチャ)
#25: Data Mesh(データメッシュ)
#26:Managed Data Stack(マネージドデータスタック)
#27:Product Analytics(プロダクト分析)
#28:Customer Data Platform(CDP)
#29:DataOps(データオプス)
#30:Data Apps(データアプリケーション)

 

まとめ

という訳で、『Modern Data Stack Categories Overview Advent Calendar 2023』のスピンオフ的企画、DMBOKで定義されているトピックにMDS(企画で参照した情報)のカテゴリをマッピングさせてみたらどうなるか、を試した内容の紹介でした。データ分析・データ周りの環境を整える際にモダンデータスタック(を構成する)サービスでカバーするとしたらどういうカバーリングが出来るか?といった部分の参考になりましたら幸いです。

上記にあるような『モダンデータスタックとは何か』的なエントリでまとめられている、参照されているような『処理や作業の流れ』毎に各種サービスやカテゴライズを整理したものは幾つか見つけられたものの、今回のようなアプローチをしているものは無さそう?だったので(既にあったらゴメンナサイ...)、『よし、いっちょやってみっか』とチャレンジしてみた次第です。『これどこにあてはめるのが良いんだろうなぁ...("〜〜分析"と付いてるものなど)とか、そもそもこれ全然カテゴライズ出来るところ無いじゃん...とか、事前の予想通り整理し切れてない感じがする着地にはなってしまった感もちょっとあります。『まぁこんなところかな...?』という気持ちで振り分けた部分もありましたので整理した内容に正直自信は無いです。エントリ途中でも言及しましたが『ここはこうなんじゃない?』という御指摘などありましたら是非フィードバック頂けますと幸いです。

改めまして、当アドベントカレンダー企画をお読み頂いた皆様、ありがとうございました!