【レポート】Data Lineageの力:データの流れを可視化し、信頼できる意思決定を – Alteryx Analytics Summit Japan 2025 #alteryx

【レポート】Data Lineageの力:データの流れを可視化し、信頼できる意思決定を – Alteryx Analytics Summit Japan 2025 #alteryx

2025.07.29

こんにちは、兼本です。

2025年7月9日(水)、赤坂インターシティコンファレンスにて 「Alteryx Analytics Summit Japan 2025」 が開催されました。

https://alteryx.event-web.jp/

このエントリでは、当日のセッション「Data Lineageの力:データの流れを可視化し、信頼できる意思決定を」についてレポートいたします。

セッション概要

データ活用が不可欠な現代において、データの起源、加工、依存関係を理解することは、コストのかかるデータエラーを防ぐためのキーポイントです。

今回のセッションでは、Alteryxの新しいデータリネージュ機能が、組織のデータ管理をどのように強化し信頼性の高いデータ活用を実現できるのかについてご紹介します。

登壇者

  • 新郷 美紀 氏
    • アルテリックス・ジャパン合同会社
    • ソリューションエンジニアリング リードセールスエンジニア

alteryx-analytics-summit2025-data-lineage-001

セッションレポート

データリネージュのストーリー(データリネージュの価値)

データリネージュの価値を示す事例として、医療機関のデータサイエンティストであるマヤさんのストーリーが紹介されました。

彼女は毎月、診断件数、収益、患者満足度、入院率などをまとめた月次レポートを分析しています。

alteryx-analytics-summit2025-data-lineage-002

ある月、彼女は再入院率が過去のトレンドと明らかに異なることに気づきました。パフォーマンスに影響を与えるような医療行為の変更がなかった場合、彼女は「このデータは本当に正しいのか?」「誰かが上流で変更を加えたのではないか?」「その変更が下流にどう影響しているのか?」といった疑問を抱くでしょう。

2025-07-29_16h52_21

このような問題は、マヤさんのようなデータサイエンティストに限らず、様々な業種で共通の課題として顕在化しています。

alteryx-analytics-summit2025-data-lineage-004

これらの課題を解決し、データに対する信頼できる意思決定を行うために、データリネージュ(データの系統や流れを可視化すること)の導入が不可欠になっています。

データリネージュ導入によるメリット

データリネージュを導入することで、以下のような変革が期待できます。

  • データ品質問題の特定と修正: 問題発生時に、その原因を瞬時に特定し、修正が容易になります。
  • 下流業務への影響の未然防止: 上流での変更が下流の業務にどのような影響を与えるかを事前に把握し、リスクを回避できます。
  • 未使用データの特定と廃棄: 不要になったデータを特定し、適切に廃棄することで、データ管理の効率化とコスト削減につながります。
  • 新たなデータの発見: システム内に存在する有用なデータ資産を容易に発見できます。
  • コンプライアンス要件への容易な対応: データの流れを可視化することで、GDPRのような規制要件への準拠が容易になります。

Alteryxのアプローチ:オープンなデータリネージュの実現へ

Alteryxは、データカタログ機能やデータ監視プラットフォーム自体を直接提供していません。その代わりに、AtlanやCollibraのような既存のデータカタログ製品、またはDataDogのようなデータ監視プラットフォームと連携することで、データリネージュ機能を提供するという独自の戦略でデータリネージュの実現に取り組んでいます。

この連携を実現するために、AlteryxはOpenLineageというオープンソースのデータフォーマットを採用しています。

alteryx-analytics-summit2025-data-lineage-005

【現在の実装とロードマップ】
alteryx-analytics-summit2025-data-lineage-006

  1. 現時点での機能:
  • 現在、Alteryxはオンプレミス製品であるAlteryx Serverのアセットのみでデータリネージュを実現しています。
  • Alteryx Designerで作成されたワークフローをServerにアップロードし、Server上で実行されたワークフローのメタデータを取得します。
  • このメタデータはOpenLineage形式に変換され、連携するデータカタログ(現在はCollibraとAtlanのみ対応)やデータ監視プラットフォームにプッシュされます。
  • 現時点では、ワークフローレベルのリネージュと、一部のデータセットレベルのリネージュがサポートされています。データセットの内部や列レベルの情報はまだ実装されていません。
  1. 今後の拡張計画:
  • Alteryx One Platform内に「Alteryx Lineage Service」を立ち上げ、OpenLineageデータを扱えるサービスを展開します。
  • クラウド環境でのワークフロー実行 (Cloud Execution for Desktop) のリネージュ取得に対応を検討しています。
  • 将来的には、Designer CloudやAuto Insightsなど、様々なAlteryxクラウド製品にデータリネージュ機能を展開し、Alteryx全体で包括的なデータリネージュを実現することを目指しています。
  • サービスアカウントのサポート、マクロ機能のサポート、多様な接続タイプのサポートを予定しています。
  • 特に重要なのは、データセットレベルのリネージュと列レベルのリネージュの実装です。これにより、どの列がどのように出力に連携しているかといった詳細な情報が取得できるようになり、顧客の多様なニーズに対応できるようになると考えられています。

【Alteryxのデータセキュリティとプライバシー】

お客様からよく寄せられるデータ転送に関する懸念に対し、Alteryxは以下の点を示しています。

  • 転送されるデータ: メタデータのみです。具体的には、ワークフロー名、データソース名、実行時間、アプリケーションIDなどがアップロードされます。
  • クラウドで保存されるデータ: データカタログサービス(Collibraなど)への接続情報のみです。実際のワークフローメタデータは一時的に使用されることはありますが、永続的に保存されることはありません。
  • データ転送のセキュリティ: メタデータ等のデータ転送には、TLS(Transport Layer Security)暗号化が用いられており、安全性が確保されています。
  • 収集データのカスタマイズ: 現時点ではカスタマイズ機能はありませんが、将来的に列レベルのリネージュ実装時には、特定の列の情報のみを選択して取得できるよう検討されています。

alteryx-analytics-summit2025-data-lineage-007

デモンストレーションでは、Alteryx Server上でのワークフロー実行から、その結果として生成されるデータリネージュの可視化までが示され、今回は、OpenLineageと連携するオープンソースのカタログフレームワークであるMarquezを用いて可視化が行われました。

補足説明(導入に適したお客様など)

データリネージュは、特に以下のお客様に適しています。

  • CollibraやAtlanなどのデータカタログをすでに導入済みの方。
  • 組織としてデータガバナンスへの関心が高く、取り組みを検討されている方。
  • 最新バージョンのAlteryx Serverにアップグレードが可能な方。 (現時点では最新バージョンのみの対応ですが、今後は変更される可能性があります)

まとめ

データリネージュは、データ分析において注目されている重要な機能のひとつです。データ関連サービス各社が「AI Ready」を掲げる中、生成AIを活用した信頼性の高い意思決定を行う上で、データリネージュの把握は不可欠な要素となっています。

Alteryxは、従来からある強力なワークフロー機能とOpenLineageというオープン標準を組み合わせることで、データリネージュの可視化を容易に実現します。さらに既存のデータカタログや監視プラットフォームとの連携により、統合的なデータ管理環境を提供します。

Alteryx Connectというデータカタログにも、以前からリネージュ機能が実装されていました。今回の機能は、その後継としても期待される重要な機能のひとつです。

今後の続報や正式リリースを楽しみにしており、データ管理の更なる向上が期待されます。

※注意事項:本記事でご紹介した機能は正式リリース前の情報であり、今後変更される可能性があります。

この記事をシェアする

facebookのロゴhatenaのロゴtwitterのロゴ

© Classmethod, Inc. All rights reserved.