Redshiftのルーツを紐解く
IT系勉強会ウォッチャーの川崎です。とある勉強会 で、Redshiftのバージョン表記が「8」台である、という話題が出まして、そこからRedshiftのルーツとなる製品の話をさせていただきました。
select version(); PostgreSQL 8.0.2 on i686-pc-linux-gnu, compiled by GCC gcc (GCC) 3.4.2 20041017 (Red Hat 3.4.2-6.fc3), Redshift 1.0.1056
この記事では、ネット上のリソースから、Redshiftのベースとなる製品についてご紹介したいと思います。
オンプレ版Redshift?
みなさんは「オンプレ版のRedshift」とでもいうべき製品があるのをご存知ですか? *1 私がそれについて知ることになったのは、CROSS2016のビデオを見ていた時でした。
「Google BigQuery × Amazon Redshift」という、非常に興味深いセッション *2がありまして、登壇者の一人がRedshiftの元になった製品の紹介をされました。
「Google BigQuery × Amazon Redshift」 http://2016.cross-party.com/program/d1
登壇者の方の話は、このビデオの6:00頃から始まり、Redshiftの元になった製品、Actian Matrixの話は11:45頃あたりになります。表示スライドも下記のブログに掲載されてます。旧製品名は「ParAccel」。
関連ブログ:
CROSS 2016 で話してきました http://adtech.cyberagent.io/techblog/archives/487
Actian Matrixによる超高速オンプレDWH環境を構築しました! http://adtech.cyberagent.io/techblog/archives/44
ほかにも、ググッてみると、興味深い記事が見つかりました。
[db tech showcase Tokyo 2015] Amazon Redshiftの元となったスケールアウト型カラムナーDB徹底解説 その名は'Matrix'
Barry Zane氏: Netezzaを作り, ParAccel MPP (Matrix)を作り, 今はグラフ分析エンジンを手がける ビッグデータ分析向けデータベースのスーパーアーキテクト ビッグデータ分析のデータベース Netezza と Matrix は兄弟?! そして、Amazon Redshiftも??? http://www.insight-tec.com/blog/barry_zane_analytic_database_architect
NetezzaとRedshiftは、同じエンジニアにより生み出された兄弟だというのです。なんと!そういうことでしたか。
データベースという製品を作っているのは、突き詰めると一人の人間なんだ、ということを、データベースの歴史 *3を調べていくと、いつも感じます。
最後に
Redshiftの名前の由来について調べてみました。
QuoraというQAサイトに投稿がありまして、Redshiftの名前の由来を質問しているのですが、回答が2件ありました。Redshiftの日本語訳は、天文学用語の「赤方偏移」(せきほうへんい)になります。 「赤方偏移」は遠方の銀河からの光が、可視光で言うと赤い方にずれる現象を指します。 これは宇宙が膨張しているために起こると考えられます。 Quotaでの回答の1つは、 AWSは「データウェアハウスの爆発」の意味を込めて「Redshift」の名前を付けたのでは?という回答でした。みなさんはどう思われますか?
脚注
- 正確には、Redshiftの元になったデータベース製品、ですね。(書き方を修正しました) ↩
- このセッションについては、また別の記事で取り上げたいと思います。→ こちらで記事にしました! ↩
- 個人的に一番のお気に入りはRDBMSの父Dr. Coddのこのエピソードです。マイケル・ストーンブレーカー教授しかり。 ↩