AWS Cloud Storage Day 取材レポート(4).[A-01] 各種サービスで活用できるAWSクラウドストレージサービスの選定指針

2013.09.25

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

講師・概要紹介

講師

北迫 清訓(アマゾン データ サービス ジャパン株式会社 ソリューションアーキテクト)

概要

AWSではS3、Glacier、Storage Gateway、EBSなど様々なストレージサービスを提供しています。バックアップ、ファイルサーバ、ファイル共有、ファイル配信等サードパーティ製品と組み合わせ、適材適所にAWSストレージサービスを活用いただける選定指針についてご紹介いたします。

セッション内容レポート

1.AWSストレージサービスのコンセプト

ストレージサービスのコンセプトとしては、大きく5つのポイントが挙げられます。

高い耐久性
99.999999999%(通称:"イレブンナイン")の耐久性を誇り、確率的にも非常に高い堅牢性を有しています。物理的に異なる3箇所以上のデータセンターに自動複製保存を行いますので、万一災害が発生したとしても、データが消える事はありません。
柔軟性
昨今、ストレージの統合も始まり、色々な局面でストレージを利用する事が増えて来ていると思います。そんな中で、AWSは柔軟性の面に於いても他の追随を許さない柔軟性を兼ね揃えています。格納容量無制限、保存期間制限無し。いつでもデータを格納し、取り出す事が出来ます。データ移行作業についてフルマネージドサービスなので面倒な作業は不要となります。
セキュア性
この点については、AWSでは最優先事項として対応しています。複数の第三者認証の取得を進めており、また、地域を指定したデータ保管が可能です。例えば、東京にデータを配置すると、日本のデータセンターに複製を行います。クライアント・サーバサイドで暗号化も対応しています。アクセス管理については、ディレクトリやファイル単位でのきめ細やかな管理が可能です。
低コスト性
AWSストレージサービスは、初期投資不要、運用費不要です。利用した分のみの、完全従量課金制となっています。
シンプル
AWSに於いては、キャパシティプランニングは不要です。連絡も要りません。

a01-001

(写真:北迫 清訓氏)

2.ストレージサービスの紹介

そして、AWSのストレージサービスとしては現在以下の4つが挙げられます。

Amazon S3:
高頻度アクセスを想定した、安価かつ耐久性の高いオンラインストレージサービス。
Amazon Glacier:
低頻度アクセスを想定した、超安価かつ耐久性の高いコールドストレージサービス。
Amazon EBS:
仮想サーバ(EC2)に接続できる、仮想ディスクボリュームサービス。
AWS Storage Gateway:
オンプレミス環境と連携した、バックアップ&クラウドストレージ利用のためのゲートウェイサービス。

AWSのアーキテクチャは、Amazon S3に様々な局面で依存しています。

  • EC2やRDS、EBS等ではデータバックアップの格納先として
  • CloudFrontではCDNのコンテンツストレージとして
  • EMR(Elastic MapReduce)やRedshiftではデータ分析プラットフォームの生データ格納部分として
  • Elastic Transcoderでは、コンテンツトランスコードの格納領域として
  • Data Pipelineでは、他ストレージサービスやワークフローを利用
  • Storage GatewayではデータアクセスGWの先の領域として
  • Glacierでは、コンテンツアーカイブとして

a01-002

3.活用アーキテクチャ

次は、AWSストレージサービスアーキテクチャに関する活用ケーススタディを見て行きましょう。

ファイルサーバストレージ

日々増加していくデータ量や規模に合わせたファイルサーバをAWSで実現するケースです。日々の作業で、容量が足りなくなった!どのデータを消して良いか分からない。そういった場合に用いるケースです。

中小規模クラウドファイルサーバの場合はEBSデータボリュームを利用する場合もありますが、実際の状況を考えるとEBSデータボリュームは10個までが妥当なところでしょう。(実際は25個使えますが) Storage Gatewayを使うと、最大150TBまで対応する事が出来ます。後ほど発表されるハンズラボ様では、この形を採用しています。このケースの場合、専用線と言うのがキーになってきます。もっと近くにファイルを置きたい場合、Storage Gatewayのキャッシュドボリュームを用いた構成を取る事で、最大150TBの内容をお客様環境から利用する事も出来ます。

a01-003

a01-004

バックアップストレージ

バックアップストレージのケースでは、外部保管ストレージとしてAmazon S3を利用しバックアップデータを保存します。"テープレスバックアップの実現"が可能となります。Storage Gatewayを利用すれば、おんプレのデータをS3に自動転送してくれます。S3対応アプライアンスNASも色々な製品が出ており、インテリジェントなバックアップの実現が可能です。

a01-301

アーカイブストレージ

アーカイブストレージのケースでは、再利用性が低く長期保存が必要なデータをGlacierへ移動させます。S3の汎用性I/Fを利用したデータアーカイブを行い、一定期間経過後自動アーカイブを行います。大きなデータを送る場合は高速ファイル転送ツールやS3のMultipart Upload機能、AWS Import/Exportでのダイレクト転送等を使います。

a01-302

データHUBストレージ

このケースでは、ビッグデータ時代のデータHUBストレージとして、S3を活用します。分析・整形用のデータの置き場所、またはEMR等のETL処理後のデータの出力先としてS3を指定し、Redshiftがその出力データをロード。そのロードデータをTableau等のBIツールで分析する、という流れです。また、フルマネージドストレージとしても利用する事が可能です。S3でファイル共有、というのは実はDropboxも採用しています。S3Toolはグローバルなファイル共有ツールです。

a01-303

コンテンツ配信ストレージ

このケースでは、フルマネージドでスケーラブルなコンテンツ配信基盤をS3で実現します。S3だけでも静的ホスティング機能の役割は果たせますが、Amazon CloudFrontを用いるとスケーラブル且つ高速配信が可能となります。また、更にElastic Transcoder等と組み合わせる事でフルマネージドな動画配信基盤の構築も可能となります。

a01-304

4.まとめ

見えない未来を予測したサイジング設計、インフラへの大幅な設備投資…そういった現状からはもう脱却しましょう。AWSストレージサービスをご活用頂く事で、ストレージ管理からデータ管理へのシフトを実現出来ます。ご清聴ありがとうございました。