[レポート]マルチクラウドなSaaS型データウェアハウス「Snowflake」が日本にやってくるぞ! Developers.IO TOKYO 2019 #cmdevio

2019.11.05

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、DA部の兼本です。

2019年11月1日(金)に東京日本橋で開催された弊社主催イベント「Developers.IO 2019 TOKYO」において、スポンサーセッションにご登壇いただきましたSnowflake株式会社 東條様のセッションをレポートします。

はじめに

皆さんは「Snowflake」をご存じでしょうか?2012年にシリコンバレーで3名のエンジニアが設立したクラウドベースのデータウェアハウス(DWH)サービスで、すでに海外では2600社を超える顧客が利用しています。
もちろん、グローバルサービスなので日本国内から利用することもできますが、国内のサポート体制やデータの保存先が海外のクラウドとなることから、まだ本格的な利用には至っていない方もいらっしゃるのではないでしょうか。

なんと、そんなSnowflakeが遂に日本上陸します!

  • セッションタイトル
    Snowflake日本上陸!Cloud型Data WarehouseであるSnowflakeの概要

  • スピーカー
    Snowflake株式会社 日本代表 東條英俊 氏

Snowflakeとは?

  • シリコンバレー発の全く新しいアーキテクチャーで提供されるクラウド型のデータウェアハウス(DWH)サービス
  • グローバルで1,600名を超える社員が在籍。APAC地域においてはオーストラリア中心だが2019年に日本オフィスを立ち上げたところ
  • 2019年にはガートナー社のMagic Quadrant(Data Management Solutions for Analytics領域)において、Leaderポジションを獲得
  • 企業規模やデータサイズによらず、さまざまな企業が採用
  • 全世界でのクエリ処理数は全世界で2,890億回/日を超えている(!)

従来のDWHとの違い

  • クラウドネイティブなアーキテクチャで、SaaSとしてDWHを使える
  • インフラ部分はSnowflake社が運用するので、従来のようにDWH基盤の保守・運用を気にする必要がない
  • オンプレミスのようにピーク時のパフォーマンスを予測して基盤を用意する必要もない
  • バックエンドにクラウドを使用しているので拡張性が高く、処理用のプロセスであるコンピュートノードは必要なときだけ用意できる

Snowflakeの強み

  • クラウドストレージ(S3、Google Strage、Azure Storage)を中心に置き、保存するデータは暗号化
  • クラウドストレージの周辺にあるギアのマークがバーチャルウェアハウス(コンピュートノード)となり、用途ごとに必要な数を用意することができる
  • コンピュートノードはXS(1サーバ/8vCPU)から4XL(128サーバ/1024cCPU)まで用意できる
  • 用途に合わせてコンピュートノードのクラスタを分離することで、業務の分離に対応する
  • つまり、ETL処理が終わらないからダッシュボードの表示が遅くなるといった問題にも対応可能である

  • 課金の対象は大きく3つある

    • ストレージ: マークアップせずにそのままスルーして価格を提示
    • コンピュートノード: 秒単位の課金でノードのサイズに依存する。ノードサイズが大きいと処理能力は2倍・処理時間は1/2になるので、結果として同じコストでよりハイスペックなノードを使える
    • マルチクラスタ: 負荷に合わせてオートスケールできる(最大10台)
  • クローン
    • 本体データに影響を与えることなく、テストデータを用意することができる
    • クローンに対する操作は本番データに影響を与えない
  • タイムトラベル
    • 過去90日までさかのぼってデータを取り出すことができるので、バックアップの必要はない
    • タイムスタンプを見ながら過去にさかのぼることができる(ただし、100日前には戻れないので90日単位でのバックアップは必要)
  • データ共有
    • データの共有相手がSnowflakeを使っていれば、相手のコンピュートノードを使うことができる。
    • コピーではなくポインタを渡すので、安全に共有できる
  • クロスクラウド
    • 複数のリージョンでアカウントを作成しても、後から統合できる
    • レプリケーションもリージョンをまたいで行える
    • さらに、AWS-GCP-Azure間でもクロスクラウドでレプリケーションすることも可能(!)

データ共有のさらに先へ

Snowflakeのミッション、ビジョンは、現状のデータウェアハウスの課題を解決するだけではなく、社内外にデータを共有する手段である。そして、それによって見えてくる新しい世界や競争力に寄与したい。

  • Snowflake Data Exchange
    • いま進めようとしているデータ共有の一歩先!
    • Snowflakeの顧客であれば、だれでもデータの提供者になれるデータ共有サービス
    • 近い将来には、グループ会社間でデータ共有を実現するための「Private Data Exchange」も提供予定(Coming Soon!)

まとめ

ということで、クラウドベースのDWHサービス「Snowflake」について、Snowflake株式会社 東條様のセッションレポートでした。
ここまで読んでSnowflakeを試してみたいと思ったあなた!すぐに試すことができます。

Snowflake のトライアルをやってみた #SnowflakeDB

上記以外にもSnowflakeについてまとめたシリーズがあります。

そして最後のサプライズとして、東條様から日本国内でのSnowflakeサービス開始について「まずはAWS Tokyoリージョンで2020年春からの提供を予定している。」とのコメントがありました!

これは益々、Snowflakeから目が離せなくなりそうですね。

では。