[アップデート] Amazon QuickSight に Starburst 向けのデータソースコネクターが追加されたので、Starburst Galaxy と接続してみた

2023.10.24

いわさです。

先日のアップデートで、Amazon QuickSight のデータコネクターに Starburst というものが追加されました。

私はあまり馴染みのあるサービスでは無かったのですが、今回は Starburst について少し調べつつ、Starburst Galaxy と QuickSight を接続する機会がありましたので、概要や手順を紹介したいと思います。

Starburst とは

Starburst はデータレイクの分析プラットフォームを提供する米国の企業です。

以前サンフランシスコで開催された Google Cloud Next '23 でもブースが出典されていたようで、AWS や Azure などを始めとする様々なプラットフォームやオンプレミスなどと接続することが可能です。

分散クエリエンジン の Trino をベースとしたプラットフォームです。
製品としては、SaaS 版の Starburst Galaxy と、セルフホスティング用の Starburst Enterprise があります。

Amazon QuickSight との接続方法

QuickSight ではデータセットを作成するために様々な接続先をデータソースとして構成することが可能です。
今回のアップデートでは Starburst Galaxy と Starburst Enterprise のどちらもサポートされています。

本日は Starburst Galaxy を接続してみました。

Starburst Galaxy 側で接続情報を取得

データソースですが、Starburst Galaxy のデフォルトクラスターに存在するサンプルカタログを今回は使ってみたいと思います。

Starburst Galaxy には Partner Connect という機能がありまして、Amazon QuickSight もサポートされています。
こちらを使うことで QuickSight から接続を行うために必要な情報を取得することが出来ます。

サイドメニューの Partner connect から QuickSight を選択します。

次の画面が表示されますので、クラスターを選択して、ユーザーとホストを確認します。
パスワードは Starburst Galaxy にアクセスしたポータルのパスワードを使います。

ちなみに上記画面の Connect to partner ボタンを押しても自動で接続などは行ってくれません。
次の様に QuickSight のポータル画面が開かれるだけです。

また、追加の情報としてカタログ名の入力が QuickSight 上で必要になります。
先程のクエリエディタからも確認できますが、Catalogs メニューからも確認することが出来ます。

Amazon QuickSight 側でデータセット作成時に情報を入力

あとは QuickSight でデータセットを作成します。
データセット作成時にあらたに「Starburst」のデータソース接続先が追加されています。

Product Type は今回は Starburst Galaxy を選択します。
データソース名は任意で良いです。

接続タイプはパブリックで、先程 Starburst Galaxy で確認した各情報を入力していきます。
接続テストボタンから検証を行ってみましょう。私は特にこれ以外の設定不要で一発で接続出来ました。

接続出来たら、「データソースを作成」ボタンを押します。
続いてスキーマを選択します。あるいはカスタム SQL を使うことも可能です。

ここではカスタム SQL は使わずにデモ用のスキーマとテーブルを選択しました。

データセットまで作成出来たら、あとは分析で使うだけですね。
ここからの流れは QuickSight 共通の手順となりますので割愛します。

以下はピボットテーブルで company_name -> location ごとの cost 合計を表示しています。

さいごに

本日は Amazon QuickSight に Starburst 向けのデータソースコネクターが追加されたので、Starburst Galaxy と接続してみました。

コネクターの接続自体はまぁさほど難しいことはないのですが Starburst を触ったことがないのでついでに試してみました。ちょっと遊んでみてますがおもしろいですね。
Power BI もサポートされているようなので、試してみようかと思っています。