Alteryx Designer Cloudのツール紹介:Data Cleasingツール #Alteryx
こんにちは、スズです。
本記事では、Alteryx Analytics CloudのDesigner CloudにあるData Cleasingツールについてご紹介します。
Data Cleasingツールの概要
Data Cleasingツールは、Preparationのカテゴリの中にあります。
Data Cleansingツールは、Nullの置換、空白や句読点の削除、アルファベットの大文字または小文字の変更などが行えます。
Data Cleasingツールの設定
Data Cleansingツールは、クレンジングの方法や対象の列を選択するだけで処理を行えます。
ここでは、各項目ごとにオプションの動作をご紹介していきます。
Remove Null Data
Remove Null Dataでは、Remove null rowsにチェックを入れると、Nullになっている行全体を削除します。
以下のデータセットでは、Row IDが2になっている行全体がNullになっています。
[Remove null rows]の処理を行うと、Nullになっていた行が削除されます。
Select Fields to Cleanse
Select Fields to Cleanseでは、クレンジングの対象のとなる列を選択します。各列ごとに選択できるほか、Check Allでは全ての列の選択のオン/オフを切り替えることができます。
Replace Nulls
Replace Nullsでは、Nullの置換を行います。
- Replace with Blanks (String Fields):Nullを空文字に置換
- Replace with 0 (Numeric Fields):Nullを0に置換
以下のデータセットにはNullが含まれています。id列は数値型、その他の列は文字列型になっています。
[Replace with Blanks]と[Replace with 0]で処理を行うと、Nullが0または空文字に置換されます。
Remove Unwanted Characters
Remove Unwanted Charactersでは、不要な文字を削除します。不要な文字は、以下のオプションから選択できます。
- Leading and Trailing Whitespace:先頭と末尾の空白を削除
- Tabs, Line Breaks, and Duplicate Whitespace:空白を1つに置換(行末、タブ、マルチスペース、その他連続した空白を含む)
- All Whitespace:空白を削除
- Letters:文字を削除
- Numbers:数字を削除
- Punctuation:句読点(! " # $ % & ' ( ) * + , \ - . / : ; ? @ [ / ] ^ _ ` { | })を削除
以下のデータセットには、一部の値に空白やタブが含まれています。
[All Whitespace]で処理を行うと、空白やタブが削除されます。
Modify Case
Modify Caseでは、アルファベットの大文字と小文字を変換することができます。
- Upper Case:全ての文字を大文字に変換
- Lower Case:全ての文字を小文字に変換
- Title Case:単語の最初の文字を大文字に変換
以下のデータセットでは、item列に文字列の値があり、全て小文字で記載されています。
[Title Case]の処理を行うと、各文字列の先頭の文字が大文字に変換されます。
最後に
Alteryx Analytics CloudのDesigner CloudのData Cleasingツールについてご紹介しました。