ちょっと話題の記事

[動画公開] データ分析を支える技術 データ分析基盤 再入門 #devio2021

分かりそうで分からない「データ分析基盤」、何のために導入して、どのようにデータを集め、どのような構成でデータを管理・蓄積するのか、欲しいデータの所在や仕様の管理など、コンサルの現場でよく尋ねられる疑問について解説します。
2021.10.15

データアナリティクス事業本部のコンサルティングチームの石川です。先週より開催しているクラスメソッド主催のオンラインカンファレンス、Developers.IO 2021 DECADEにて「データ分析を支える技術 データ分析基盤 再入門」というテーマにてセッション動画と資料を公開いたしました。

セッション概要

本セッションでは、データ分析基盤を理解するのに必要となる基礎的な要素技術とDX(Digital Transformation)推進において必要とされるデータ管理について解説します。データ分析基盤をこれから導入したい、すでに導入しているデータ分析基盤を改善したいという方には最適なセッションです。

  • アジェンダ
  • データ分析基盤入門
  • データ分析基盤の構成要素
  • データ分析基盤のデータ処理
  • データ分析基盤のデータ管理
  • データ分析基盤の今後
  • まとめ

セッション動画(約18分)

セッション資料

まとめ

「データ分析基盤」が分かりそうでわからない理由は、2つあると考えられます。

1つ目は、DWH(Data Ware House)や Data Lakeのどちらが分析データのデータストアとして最適であるかです。現在は、各ベンダがそれぞれ進化したLake Houseというアーキテクチャを提唱しており、DWH(Data Ware House)や Data Lakeという言葉は併用されながらも、Lake House Architectureが主流になるでしょう。

2つ目は、DX(Digital Transformation)推進において、データガバナンスの重要性が求められます。その中で、データ利活用を推進する組織づくり、セキュリティ、個人データやパーソナルデータの取り扱いの検討、欲しいデータの所在や仕様の管理にはData Catalogの導入、外部データの収集、周辺サービス連携など、データ分析基盤が担う範囲が拡大しているからでしょう。

最新のクラウドDWHサービスのデータシェアリングを活用することで、データを論理的に一元管理・統合できるようになり、システム構成も変化が予想されます。

本来ならAWSやGoogle Cloudにおける具体的な構成例などを補足したかったのですが、それはまたの機会とします。

内製化支援する仲間を募集しています!

データ分析の民主化、データ分析・機械学習の内製化支援する仲間を募集しています。AWS・GoogleCloudエンジニアとして入社した後、ソリューションアーキテクトやコンサルタントへのキャリアアップも歓迎します。(募集要項はこちら)。

合わせて観たい!

DWH(Data Ware House)については、以下の動画もご覧ください。