データカタログ製品『Alteryx Connect』ってなあに? – 今日からはじめるAlteryx再入門アドベントカレンダー

2020.12.24

こんにちは、ソリューション部・新納(にいの)です。

本エントリは2020年アドベントカレンダー『今日からはじめるAlteryx再入門』の24日目のエントリです。この企画も残りあと1日…早かったような、ほっとするような…これで心置きなく年越しできそうです。

このアドベントカレンダーの企画は、Developers.IOにてAlteryxの情報をお届けしてきたメンバーによるAlteryxを1から学べるシリーズになっています。Alteryx触ってみたい!という方の入門記事として、Alteryx使っているけど改めて基礎から学びたい!という方の再入門記事としてご活用いただければ幸いです。

24日目の今日は「データカタログ製品『Alteryx Connect』とは」をお届けします

データ分析で抱える課題~データのことがよくわからない編~

「ちょっとこのデータをAlteryxで分析してみて!」

「わかりました!……このデータは一体どこから来たの…?このフィールドはどういう意味……?」

上記の例は極端かもしれませんが、分析に使用するデータそのものの情報が少ないことはよくある話だと思います。分析に先立って大切なことはデータそのものです。分析ツールをいくら導入したところでデータそのものが適切でなければ間違った分析結果を招きかねません。また、どんなデータがどこに格納されているか管理されておらず、「こんなデータが存在していることすら知らなかった…」なんてケースもあるでしょう。

このような課題にこそデータを管理するデータカタログが役立ちます。

データカタログ、Alteryx Connectとは

情報資産(アセット)を発見・探索するためのサービスであり、データ自体のの辞書のようなものです。組織内に存在するデータを管理する役割を持ちます。

Alteryx ConnectはAlteryx社が提供するデータカタログ製品です。Alteryx Serverのアドオン製品であり、サーバーにインストールして利用者はWebブラウザからアクセスして使用します。Alteryx Connectではデータそのものではなくメタデータと呼ばれるデータに関するデータ(項目名、テーブル名など)を管理する仕組みをとっています。

Alteryx Connectでできること

Alteryx Connectでできることは、探索する・理解する・寄与するに大きく分けられます。

探索する

データカタログのメインといってもいい機能で、データアセットの検索ができます。

画像のように、検索ウィンドウからデータベース、Alteryx Designerで作成したワークフロー、Tableauで作成したレポート、用語集を探すことができます。

理解する

データがどのワークフローから作成されたのか、元となるデータはどれか、といった情報をデータリネージ(系統)として確認可能です。データの出所がわかると本当に信頼してもいいデータなのかの判断材料となります。

また、データアセット中で使用されている用語の説明を用語集(Glossary)としてまとめておくこともできます。

寄与する

Alteryx Connectでは、管理者だけでなく利用者自身もデータカタログの整備に寄与できるという特徴があります。

データの信頼性を精査できるロールのユーザーであれば、CERTIFIED/DO NOT USEといったタグをデータアセットに付与できます。これにより、仕様を推奨されているアセットかどうかを一目で判断できます。

権限の一番弱いユーザーであっても、データアセットにLIKE/DISLIKEを付与できます。これによってデータオーナーへフィードバック可能です。上述のCERTIFIED/DO NOT USEや、LIKE/DISLIKEを付与することで検索時の表示順序が変わります。CERTIFILEDやLIKEを付与されたアセットは検索にヒットしやすくなり、ユーザーの目に留りやすくなります。

以下の動画セッションでは、実際の画面操作デモを行っていますのでご参照ください。

Alteryx Connectを運用するなかで大切なこと

Alteryx ConnectはIT部門の管理者だけが頑張れば完璧なデータカタログになるというわけではありません。組織を運営していく中でデータは増えていく一方で、管理者一人だけがすべてのデータを正確に把握することは不可能と言っていいでしょう。

前述したような利用者ユーザーがデータオーナーへフィードバックできる機能があるように、Alteryx Connectを運用していくためには組織内のユーザーの協力が欠かせません。IT部門の担当者のみが責任を負うのではなく、組織内全体でデータカタログの考え方や文化を浸透させていくことも大切な要素となります。とはいえ、組織によって適切な運用方法は変わりますので、まずは小さなグループ単位でAlteryx Connectを使いはじめてみた上で組織全体に展開してみるのもいいかもしれません。

まとめ

Alteryx Connectの再入門でした。本エントリでは概念の部分に多く触れましたが、以下のタグに具体的な機能や使い方のエントリがまとめられていますのでご参照ください。