ウェビナー「Snowflakeはじめの一歩」で登壇しました

いただいた質問とそれに対する回答は随時更新します
2020.03.27

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

大阪オフィスの玉井です。

3月27日(金)のお昼時に、弊社が開催した下記ウェビナーで登壇しました。

本記事では、ウェビナーの資料の共有、それと、登壇時にいただいた質問及びそれに対する回答をご紹介します。

資料

(ウェビナー中にあった)Q&A

IaaSとしての提供はありますか

IaaSとしての提供はございません。

Snowflakeのプラットフォームは、既存のパブリッククラウドサービスの上に実装され利用者に提供されます。どのパブリッククラウドを使用するかは、Snowflakeの利用開始時にAWS、Azure、GCPから選択することができます。

対応しているETLツールはどのくらいありますか

様々な製品との連携が可能ですが、詳細については、以下のリンクをご覧ください。

タイムトラベルについて、「数分前のテーブル」や「数時間前のテーブル」に対してクエリするということも可能ですか

可能です。

詳細は下記ブログエントリをご覧ください

Amazon Redshiftより優れている or 劣っているところがあれば教えてください

利用形態により、製品の持つ特長が長所、短所となるので一概に長所/短所としてお伝えするのは難しいです。

SnowflakeがRedshiftと異なる点としては…

  • 最初からCPU/メモリのセット(仮想ウェアハウス)と、ストレージが分離している設計である(最新のRedshiftには同じような構造のインスタンスタイプもあります)
  • 仮想ウェアハウスにまたがってデータを共有できる
  • 複数のクラウドサービス(AWS、Azure、GCP)上で動作する

…等が挙げられます。

ストアドプロシージャも使えるようですが、特徴や使用事例などあれば教えてください

ストアドプロシージャにつきましては、(イチからご紹介すると)長くなりますので、まずはSnowflakeのドキュメントをご参照ください。

データロードで「ステージにファイルをコピーしている間(完了前)は、Snowflakeはロードしない(ファイルコピー完了まで待つ)」という制御は可能ですか

内部ステージの場合、ファイルのPUTが完了しないとロードできないようになっています。

外部のステージの場合は、パブリッククラウドのストレージサービスを使用するので、お使いになるクラウドサービスの動作に依存しますが、基本的にはファイルコピーが完了してからSnowflakeへデータをロード…という仕組みになっています。

おわりに

2020年3月現在、弊社は新型コロナウィルスの影響を受けて、原則出社禁止となっており、今回のウェビナーも自宅で実施しました。

奈良県の片田舎にある自宅から、画面の前で、一人黙々としゃべっていたのですが、リアル登壇と違って、聴講者の反応がサッパリわからないところが非常に難しく感じました。…いや、難しいというよりは、「なんか一人で喋り続けているけど、これ大丈夫かな…そもそも聞こえてなかったらどうしよう…」みたいな感じで、不安に駆られながらの登壇でした(終わった後でQ&Aを見て安心しました)。

良い面としては、(普段のリモートワークでもいえることですが)自宅なので、遅刻に対する心配がほとんどいらない点でしょうか(リアル会場だと「寝坊して遅刻したらどうしよう」みたいなことを毎回考えるタイプなので)。

また、ウェビナーの冒頭でもお話したのですが、この日はAmazonで注文した物が届く日だったので、「ウェビナー中にピンポーンって鳴ったらハズカシ~」とか思ってたのですが、ウェビナー中に届くことはありませんでした。

(Snowflakeと関係ないのですが)こんなご時世ですが、ネットを通じてコンテンツを発信することはできますので、是非みなさんもチャレンジしてみてください(ちなみに今回はZoomを使いました)。