Challenge #16: Parsing Out the New-line Character 〜改行文字を含むデータの整形〜 – Alteryx Weekly Challenge

2018.11.19

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。

Alteryx CommunityWeekly Challengeに挑戦するシリーズ。今回は改行文字を含むデータの整形を行います。

Challenge #16: Parsing Out the New-line Character

お題

今回挑戦するお題はこちら。

「Input」側のデータはこちら。

Resultsウィンドウでは「Field_1」列の1行目のセルには文章が1行分表示されています。データが入力されているText Inputツール(In/Out -> Text Input)の設定ウィンドウを確認すると、文字列が2行にわたって入力されていることが分かります。

「Output」側のデータはこちら。2行になっていた文字列は1行に整形されています。

解答の概要

今回作成するワーフクローは以下の通りです。

  1. RegExツールで改行文字の削除
  2. DateTimeツールで日付をYYYY-MM-DDに変換
  3. Selectツールで不要な列の削除と名前の編集

解答の詳細

RegExツール(Parse -> RegEx)を使用して、改行文字を削除して2行の文字列を1列に編集します。設定ウィンドウの Regular Expression に、プルダウンメニューから \n Newline を設定します。今回は文字を削除するため、 Output Method には Replace を設定します。

DateTimeツール(Parse -> DateTime)を使用して、日付をYYYY-MM-DDに変換します。 Select the format that matches the incoming string field には Custom を選択し、 Specify the format of the incoming string field に dd-Mon-yy を入力します。

Selectツール(Preparation -> Select)を使用して、列名の変更と不要な列の削除を行います。元の日付の「Field_3」列の選択を外し、列の名前を「Poem」「Poem_ID」「Poem_Read_Date」に変更します。

ワークフローを実行します。結果を確認して完成です。

最後に

今回はWeekly ChallengeのChallenge #16: Parsing Out the New-line Characterに挑戦してみました。今後もWeekly Challengeに挑戦していきます。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400