Redshiftのルーツを紐解く

2016.05.27

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

IT系勉強会ウォッチャーの川崎です。とある勉強会 で、Redshiftのバージョン表記が「8」台である、という話題が出まして、そこからRedshiftのルーツとなる製品の話をさせていただきました。

select version();
PostgreSQL 8.0.2 on i686-pc-linux-gnu, compiled by GCC gcc (GCC) 3.4.2 20041017 (Red Hat 3.4.2-6.fc3), Redshift 1.0.1056

この記事では、ネット上のリソースから、Redshiftのベースとなる製品についてご紹介したいと思います。

オンプレ版Redshift?

みなさんは「オンプレ版のRedshift」とでもいうべき製品があるのをご存知ですか? *1 私がそれについて知ることになったのは、CROSS2016のビデオを見ていた時でした。

「Google BigQuery × Amazon Redshift」という、非常に興味深いセッション *2がありまして、登壇者の一人がRedshiftの元になった製品の紹介をされました。

「Google BigQuery × Amazon Redshift」
 http://2016.cross-party.com/program/d1

登壇者の方の話は、このビデオの6:00頃から始まり、Redshiftの元になった製品、Actian Matrixの話は11:45頃あたりになります。表示スライドも下記のブログに掲載されてます。旧製品名は「ParAccel」。

関連ブログ:

CROSS 2016 で話してきました
 http://adtech.cyberagent.io/techblog/archives/487
Actian Matrixによる超高速オンプレDWH環境を構築しました!
 http://adtech.cyberagent.io/techblog/archives/44

ほかにも、ググッてみると、興味深い記事が見つかりました。

[db tech showcase Tokyo 2015]
 Amazon Redshiftの元となったスケールアウト型カラムナーDB徹底解説 その名は'Matrix' 

 Barry Zane氏: Netezzaを作り, ParAccel MPP (Matrix)を作り, 
 今はグラフ分析エンジンを手がける ビッグデータ分析向けデータベースのスーパーアーキテクト
 ビッグデータ分析のデータベース Netezza と Matrix は兄弟?! そして、Amazon Redshiftも???
 http://www.insight-tec.com/blog/barry_zane_analytic_database_architect

NetezzaとRedshiftは、同じエンジニアにより生み出された兄弟だというのです。なんと!そういうことでしたか。

データベースという製品を作っているのは、突き詰めると一人の人間なんだ、ということを、データベースの歴史 *3を調べていくと、いつも感じます。

最後に

Redshiftの名前の由来について調べてみました。

QuoraというQAサイトに投稿がありまして、Redshiftの名前の由来を質問しているのですが、回答が2件ありました。Redshiftの日本語訳は、天文学用語の「赤方偏移」(せきほうへんい)になります。 「赤方偏移」は遠方の銀河からの光が、可視光で言うと赤い方にずれる現象を指します。 これは宇宙が膨張しているために起こると考えられます。 Quotaでの回答の1つは、 AWSは「データウェアハウスの爆発」の意味を込めて「Redshift」の名前を付けたのでは?という回答でした。みなさんはどう思われますか?

脚注

  1. 正確には、Redshiftの元になったデータベース製品、ですね。(書き方を修正しました)
  2. このセッションについては、また別の記事で取り上げたいと思います。→ こちらで記事にしました!
  3. 個人的に一番のお気に入りはRDBMSの父Dr. Coddのこのエピソードです。マイケル・ストーンブレーカー教授しかり。