[登壇ブログ] 人人人〜信頼できるデータを届け、使うのは?〜 #まるクラ勉強会
2024年1月29日(月)に開催された、まるクラ勉強会 ONLINE #1で「人人人〜信頼できるデータを届け、使うのは?」というタイトルでお話ししました。当日の録画がYouTubeで公開されているので資料とともにご紹介します。
動画
資料
資料内のリンク一覧
Speaker Deckだと資料内のリンクから飛べないことを知ったので、リンクを貼っておきます:
- pg.8,19: The Modern Data Stack Repository. - Category
- pg.15,58: モダンデータスタック最前線〜データオブザーバビリティ〜
- pg.16-18: What is Data Reliability?
- pg.35: dbtとLookerの境界線を定めます!
- pg.41: LAMS Style Guide
- pg.41: Looker運用を2年続けて見えた課題と次の一手
- pg.41: [レポート]マネーフォワードが実践する「SSOT」とデータの民主化に向けた取り組み
- pg.52: Best practice guides
- pg.52: dbt Style Guideを読む
- pg.52: Example Looker Developer Guidelines
反省
セッション中の「データの信頼性」というのがちょっとグレーな使い方をしてしまったと反省しています。
データ信頼性エンジニアリングの話もしたので、その辺のきっちりと分けて話をするべきでした。セッション中でわたしが使っている「データの信頼性が高まる」とか「信頼できるデータ」というのは大体は、手元に持ってきたデータの来歴がわかることという意味で使っています。
そのファイルの元のテーブルとか、そのテーブルが参照した上のレベルのテーブルはなんだったのかがすぐに辿れるし、どんな方法で集計を行ったのかもLookerなりDWHに残っている状態のことを「データの信頼性が高まる」とか「信頼できるデータ」と言っていました。(反省)
まとめ
動画の中でも、なぜ今回のテーマで話をしたいと思ったのかをお話ししたんですが、昨年の夏にデータデータオブザーバビリティ製品のMonte Carloについて色々触ったり情報収集した際に、こんなにいい感じの製品でもやっぱり大事なのはドキュメントだよとブログに書いているのがずっと残っていて、実際の自分が取り扱っている製品でもきちんと特徴を押さえて使ってもらった方がいいよねと思うところもあったりしたので、今回これら諸々の思いをきちんと形にして発表できる場があってよかったです。
結局は人間だよなっていう似非相田みつをみたいなことを思うなどする今日この頃でした。
おまけ
いくつかのスライドのちいちゃく希望BGMをつけていたので、どぞ。
今日の登壇の希望BGM貼ってくか…#まるクラ勉強会
— キャサリン (@cath08400372) January 29, 2024