[ブース紹介]データプレパレーションソリューション-Fivetran、etleap、datacoral #reinvent

2019.12.11

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。DA部プリセールスエンジニアの兼本です。

AWS re:Invent 2019のエキスポのスポンサーブースから、データプレパレーション系のソリューションをいくつかご紹介します。

Fivetran(BoothID #512)

Fivetranはフルマネージドのデータパイプラインサービスを提供しています。

最近では、弊社ブログに登場したこともありますので、名前を知っている方もいらっしゃるかもしれません。

etleap(BoothID #1010)

こちらは2013年に設立した日本未上陸のデータパイプラインソリューションです。コードフリー、RedShiftやSnowflakeへのデータ出力を売りにしていました。
さまざまなブースを見て回りましたが、海外のETL/データパイプライン製品は、AWS、GCP、Azureは勿論のこと、Snowflakeへの対応を謳っているものが多いように感じました。
etleapは、コードフリーで簡単なETL処理を作成することができるようになっており、読み込んだJSONデータを解析することもできるので、ビジネスユーザでも使いやすい印象です。

登録したタスクを一元管理するダッシュボードも提供されています。

datacoral(BoothID #1105)

これはちょっと面白くて、データパイプラインなのですが、サービス提供ではなくAWS-nativeなサーバレスのソリューションということです。
datacoralを利用する場合、利用者のAWSアカウント上で、datacoralのインストールを行うことで、s3 bucket、Redshift Cluster、Lambda functionなどを使ったサーバレスのデータパイプラインの仕組みが構築できるようになっています。

Web GUIも用意されているのですが、ETLの加工処理などはSQLクエリを使って記述します。

様々なシステムから読み込んだデータテーブルをもとにビューを作成する仕組みも提供されています。

ビジネスユーザ向けではないものの、エンジニア受けのよさそうなソリューションですよね。
話聞いててテンション上がってブースの写真を撮り忘れてしまいました。

まとめ

いかがでしたか。
データパイプラインツールに関しては、別エントリでもTalend Data Pipeline Designer & Stitch、Xplentyなどをご紹介してまいりましたが、さまざまなクラウドサービスに蓄積されたデータを素早く簡単に連携できるので、個人的には結構面白いソリューションだと考えています。

以上、最後まで読んでいただきありがとうございました。