Glue DataBrewで電話番号フォーマット機能が使えるようになったので、ためしてみた

2022.02.14

いわさです。

Glue DataBrewでは様々なデータの加工が可能ですが、電話番号をE.164形式(+81xxxxxxxxxのやつ)に揃えることが出来るようになりました。
別フィールドにそのデータの国情報があれば、そちらを参照し、自動で国番号を付与してくれます。

使い方

フォーマット -> Phone number -> E.164 から利用可能です。

設定時に対象列を指定しますが、国番号を補完する場合は情報を指定する必要があります。
指定方法としては、デフォルトを直接指定するか、国情報を列で指定するか選択出来ます。

デフォルトの直接指定

直接指定の場合は、単一の国を選択します。
データに国に関する情報が含まれていなくても、明示的に指定することが出来ます。

上記のように-( )が使われている形式が混在していても事前に除去処理なしで揃えることが出来ます。

今回は、03と011、あとは050/080/090などと0120を試してみました。
11というのもためしてみたのですがこちらは変換の対象外になりました。

213はロサンゼルスなんですが、変換されませんでした。
詳細仕様の記述が見当たらなかったのですが、+81で正しいかどうかチェック出来ているみたいですね。

列での指定

国情報を別列で指定することも出来ます。
データに国情報が含まれている必要はありますが、複数の国の電話番号が混在している場合でもこの方法を使うと対象の国番号を使ってくれます。

こちらでは、アメリカの国番号+1がちゃんと付与されてますね。
また、日本については+81が使われています。

注意点

変換前の電話番号に依りそうですが、一部の電話番号は変換されませんでした。

011-123-xxxxは存在しませんが、011-456-xxxxは事業者では未使用ですが形式としては有効みたいです。うーん。

総務省|電気通信番号制度|電気通信番号指定状況 (電気通信番号計画(令和元年総務省告示第6号)第1第4項による公表)

11-とかは国内プレフィックスの仕様から外れているので対象外になるのは理解出来たのですが。
ドキュメントにこの仕様に関する情報がなかったので調査しています。
わかり次第追記したいと思います。

さいごに

本日はGlue DataBrewでの新機能電話番号フォーマット機能をためしてみました。

日本の電話番号も対応しているので使えそうなのですが、注意点で挙げた挙動をちゃんと把握しておきたいですね。
仮に把握出来てたとしてもどういうときに変換対象外になるかわからないので、変換されたかされてないかは別途何らかの方法でチェックすべきだなと思いました。