[Alteryx Designer:ツールのご紹介]データクレンジングツールについて

2020.06.08

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

初心者向けの認定試験Alteryx Designer Coreについてこちらをご覧ください。

はじめに

Alteryx Designer Coreの認定試験に必要なツールの紹介ブログです。今回はデータクレンジングツールについて詳しくご説明させていただきます。

参考ページ:

データクレンジングツール(Data Cleansing Tool)

データクレンジングツールが入力データをきれいに変化する役割を持ちます。 Null 値の置き換え、不要な文字の削除、大文字/小文字の変換など、基本的なデータクレンジング操作を実行します。 2020.2版以降は新機能としてNullデータ「Null行とNull列」をまとめて削除することも可能になりました。

データクレンジングはマクロです。マクロをカスタマイズして、特定のニーズに対処することができます。ツールを右クリックし、「マクロを開く」をクリックします。ワークフローを確認し、ツール設定を修正してニーズを満たします。

新しく生成されたフィールド名を操作するマクロなどの動的設定で使用する場合、[すべて] オプションが選択されていても、ツールはフィールドと対話しません。データクレンジングツールを複数フィールドフォーミュラツールに置き換えることを検討してください。

15 桁を超える数字は文字列として扱う必要があり、そうしないと精度が失われます。セレクトツールを使用して、フィールドタイプを文字列に設定します。

設定

Null データの削除

このオプションを選んだら対象のデータを削除します。Null 行とは、全ての列に関してNull 値を持つ行。Null 列とは、全ての行に関してNull 値を持つ列。しかし、この機能では空白の値(Null で無い空白値 [""] )は削除されません。

Null の置換

このオプション選んだら Null を空白または 0 に置換します。

不要な文字の削除

このオプション選んだら目的の値を削除します。 「先頭と末尾の空白」文字を削除する。 「タブ、改行、重複した空白」は行末、タブ、複数のスペース、その他の連続した空白を含め、すべての空白を単一の空白に置き換えます。 「すべての空白」はすべての空白を削除します。 「文字」はすべての文字を削除します。これには、ラテンアルファベット以外の文字も含まれます。例:A b Z À é ö 「数字」はすべての数字を削除します。 「句読点」は以下の文字を削除します。例:!" # $ % & ' ( ) * + , \ - . / : ; ?@ [ / ] ^ _ ` { | } ~

大文字/小文字の変換

このオプション選んだら文字列データ型の大文字を変更します。 「大文字」は文字列内のすべての文字を大文字にします。 「小文字」は文字列内のすべての文字を小文字にします。 「タイトルケース」は文字列内のすべての単語の先頭文字を大文字にします。

ユースケース

Null データの削除

Null の置換

不要な文字を削除

大文字/小文字の変換

まとめ

データの前処理をする際にこちらのツールが便利です。データをキレイにする役割です。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400