[レポート] クラスメソッドxメソドロジック共催:イチから始めるデータ活用!『Immuta編』を開催しました。
先日2024年03月13日(水)、クラスメソッド株式会社と株式会社メソドロジックの共催イベント『【毎週開催】メソドロジック社共催!イチから始めるデータ活用!8週連続ウェビナー』の第4回開催回である『イチから学ぶImmuta編』を開催しました。
当エントリではその内容についてレポート致します。
目次
イベント概要
第4回目となる今回取り扱うテーマは『Immuta』です。
ちなみにプレスリリースで告知・紹介を行ったシリーズ開催内容は以下の通りとなっています。
- 1日目:2024年02月20日(火) イチから学ぶデータメッシュによるデータガバナンス
- 2日目:2024年02月28日(水) イチから学ぶSnowflake
- 3日目:2024年03月06日(水) イチから学ぶDatabricks
- 4日目:2024年03月13日(水) イチから学ぶImmuta
- 5日目:2024年03月21日(木) イチから学ぶFivetran
- 6日目:2024年03月28日(木) イチから学ぶdbt
- 7日目:2024年04月03日(水) イチから学ぶHightouch
- 8日目:2024年04月10日(水) イチから学ぶLooker
参考:
前回第3回目の開催レポートは以下をご参照ください。
イベントレポート
イチから学ぶImmuta
- 登壇者:安原朋紀(クラスメソッド株式会社 アライアンス事業部)
データセキュリティプラットフォームである Immuta について、データセキュリティプラットフォームが必要となる背景から、Immuta の概要、Immuta の主な機能として以下の4つをご紹介しました。
- Data Access Control
- 属性ベースのアクセス制御(Attribute-based access control:ABAC)による動的かつきめ細やかなデータアクセス制御とデータ保護が可能
- Integration
- 主要なクラウドデータプラットフォーム と統合可能
- Immuta 側でポリシーを定義すると自動的に DWH 側にその変更が適用される
- Data Discovery
- 機密データの自動的な検出と分類機能を提供
- Policy と組み合わせることでデータ保護の自動化が可能
- Detect
データ活用支援サービスのご紹介
- 登壇者:白石 章氏(株式会社メソドロジック 代表取締役)
基本的な内容は前回までの内容と同様のため割愛します。過去の紹介内容については下記エントリをご参照ください。
[レポート] クラスメソッドxメソドロジック共催:イチから始めるデータ活用!『データメッシュによるデータガバナンス編』を開催しました。 | DevelopersIO
ここでは差分の情報を追加で紹介します。
今回のウェビナーでは、白石様からデータ分析基盤構築におけるデータカタログの導入に関する注意点についてご紹介がありました。
- データカタログの誤解
- データカタログ導入の注意点
- データという製品ができてから、「どのデータをカタログにのせるか」を考えても遅くない
全体質疑応答
セッション終了後は、全体を通して挙がっていた質問に対する回答タイムとなりました。挙がっていたものについて下記に記載します。
Q1. ChatGPTにデータガバナンスの具体的な機能を聞くと以下が挙げられました。
Immutaはセキュリティ以外にどこまでカバーした製品でしょうか?
・セキュリティ(データアクセス管理)
・データ品質の確保
・コンプライアンスとリスク管理
・データのルーツ 血統 リネージの管理
・データライフサイクル管理
・データ利用者のステークホルダー間のコミュニケーションと協働
- A1. 上記項目という観点ですと、Immuta としては、現時点では以下をカバーしていると考えています。
- セキュリティ(データアクセス管理)
- コンプライアンスとリスク管理
- データ利用者のステークホルダー間のコミュニケーションと協働
「セキュリティ(データアクセス管理)」については Immuta の主要機能で対応しています。 「コンプライアンスとリスク管理」についても、 Immuta のデータアクセス管理機能によって結果担保されるものと考えます。「データ利用者のステークホルダー間のコミュニケーションと協働」という観点は、発表資料には含みませんでしたが、Immuta の「Project」という機能でカバーできるのではないかと考えています。「Project」を使用すると、そのユースケースに関連するデータとユーザーを、まとめることができます。これにより、同じプロジェクトメンバー間で共通するデータポリシーを設定可能です。
※本記事にて追記
Immuta の「Project」機能については、以下にまとまっていますのであわせてご覧ください。
[Immuta] Projectを設定してデータガバナンスを効かせつつ効率よくデータ分析を行えるようにする | DevelopersIO
Q2. Immuta を選定評価する際に、RBACとABACによる側面で評価するとした場合、それぞれを採用するべき基準や条件(ユースケースや業種、業態)はどのような内容になりますでしょうか? 中小企業か大企業かによる規模の分類以外に指針がありましたらご教授ください。
- A2. 以下の観点が参考になると思います。
- ユースケース:対象となるデータ基盤(DWH)の用途として、新規ユーザーの流入がどの程度発生するか、はまずポイントになると思います。頻繁に新規ユーザーが追加され、アクセス要件も増える場合は ABAC が、ある程度決まった範囲内での利用にとどまるのであれば、RABC がまずは候補となります。また、そもそもきめ細やかなアクセス要件が発生し得るか、も考慮が必要です。
- 業種、業態:組織として明確に定義されたグループがある場合、まずは RBAC に落とし込むことが難易度・コストともに容易なので一般的なアプローチになります。
Q3. Immuta 導入メリットのうち、最大のものを1つ挙げるとすると何になりますでしょうか?
- A3. データアクセス制御の簡素化が一番のメリットと考えます。DWH と統合することで、アクセス権の付与、ポリシー設定までを自動化、または Immuta で設定~即座に反映できるので、データ管理者の工数を削減できます。これにより、データ管理者やデータエンジニアは、よりデータ利活用に関する活動に注力できます。
Q4. データカタログは、例えばExcelでテーブル一覧・定義書が整備されていて、どのデータがどこにありどういう意味なのかがわかればまずは十分だったりするのでしょうか? アクセス権管理もDBやBIツール側でも制御できますし、それらが面倒になってからツール導入でも良さそうには聞こえました。 (そもそも定義書が無かったり、アクセス権管理ができていないこと自体の整備が先かなと考えています)
- A4. テーブル一覧・定義書が整備されていれば問題ないと思います。まずは、どのデータをカタログに乗せるべきか議論し、アクセス管理も行い、使ってみてからの検討でも問題ないと考えます。
Q5. タグ付けは日本語でも実用レベルのものでしょうか?自動判別に任せようと思っていても、抜けがあると結局は自動判別は信用できない!となって人でやらざるを得ない状況になりそうなので
- A5. Immua では事前定義されたロジックに基づいてタグ付けを行うため、データ値が日本語のデータだと対応しないことも考えられます。対応方法として、ユーザー側で独自のパターンを定義することが可能なので、検出したいデータの規則に当てはめ可能であればこちらで対応可能と思います。
Q6. ImmutaとSnowflakeを統合した際、ロールやマスキングポリシーが大量に自動生成される感じですか?ユーザーはロールを選択して利用することになるのでしょうか?
- A6. Immuta と Snowflake を統合すると ポリシーごとに マスキングポリシーやロールが作成されます。ただし、管理者も含めユーザーは各ポリシーやロールを意識する必要はありません。紐づけを行ったユーザーは、ユーザーごとのロールが作成されます。また、ロールは、各ポリシーの権限を継承しているので、ユーザーごとに作成されたロールを使用することで、Immuta で設定したアクセス要件に基づきクエリできます。
まとめ
以上、クラスメソッドxメソドロジック共催:イチから始めるデータ活用! 8週連続ウェビナーの第4回、『イチから学ぶImmuta編』開催レポートでした。
当レポートのセッション内容について、また施策・御支援内容についてのお問い合わせに関しては下記のサイトから宜しくお願い致します。
次回第5回は2024年03月21日(木)、『イチから学ぶFivetran』編です。お楽しみに!