AWS再入門2018 クラウドストレージサービス編

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。池田です。節分を迎えてからはAlexaスキル開発トレーニングを参考に少しずつ勉強を進めています。具体的なオリジナルスキルのアイデアはまだぼんやりしていますが、新しい技術に触れられる時間は楽しいですね。

自身の学習用にと各サービスの特徴など基本事項を中心に整理してきたAWS再入門2018シリーズですが、ついにDevIO公式シリーズとしてひとつのカテゴリーになりました。興味のある方はこちらから他の投稿もご覧ください。

はじめに

今回はAWSが提供している5つのクラウドストレージサービスについて、それらの特徴と違いなどを整理していこうと思います。

もくじ

  • 概要
  • Amazon Simple Storage Service(Amazon S3)
  • Amazon Elastic File System(Amazon EFS)
  • Amazon Elastic Block Storage(Amazon EBS)
  • Amazon Glacier
  • AWS Storage Gateway
  • まとめ
  • 概要

    • 単純なバックアップ用途だけでなく、DRの一環としてのデータアーカイブ、オンプレ設備の維持コスト対策やグローバル展開など、様々なユースケースに対応できるよう複数のサービスが提供されている
      • Amazon Simple Storage Service(Amazon S3)
      • Amazon Elastic File System(Amazon EFS)
      • Amazon Elastic Block Storage(Amazon EBS)
      • Amazon Glacier
      • AWS Storage Gateway

    Amazon Simple Storage Service(Amazon S3)

    • AWSの最初のサービスとしてリリースされた
    • 99.999999999%の耐久性を誇るオブジェクトストレージ
    • Webベースのデータストレージサービス
    • 保存できるファイル数は無制限
      • 1つのファイル(オブジェクト)の最大サイズは5TB
    • オブジェクトはバケットに保存され、自動的に3箇所以上の物理デバイスに複製される
      • リージョン内の他のAZ
      • データセンター内の複数デバイス
    • バージョニング機能によるデータの誤った削除や上書きからの復元が可能
    • 複数のセキュリティ機能が利用可能
      • SSL通信による転送時の保護
      • ポリシーによる詳細なアクセス制御を用いたバケットの保護
      • データの自動暗号化機能
    • Webサーバとしての利用
      • HTMLおよび画像ファイルなどで構成された静的コンテンツの公開が可能
      • 各種スクリプト言語やDBの導入は不可
      • 動的コンテンツは別のWebサーバに配置し、画像や静的コンテンツのみをS3に配置することでWebサーバの負荷を低減
    • 他のAWSサービスとの連携
      • IAMおよびAWS Key Management Service(KMS)
      • CloudWatchやCloudTrailおよびイベント通知
      • Lambda
      • EMRやRedshiftなど
    • クロスリージョンレプリケーション(CRR)
      • 設定により、異なるリージョンにあるバケット間でオブジェクトを自動的に非同期コピーさせることが可能
      • 異なるAWSアカウントが所有するバケット間でも可能(所有者オーバーライド)

    Amazon Elastic File System(Amazon EFS)

    • 2018/02/08現在、東京リージョンでの利用はできない
    • Amazon EC2と組み合わせて利用するスケーラブルなファイルストレージ
    • シンプルなインターフェイスによる容易な構築が可能
    • 収容するファイルサイズに応じて自動的に拡張や縮小が行われる
      • ペタバイト規模までの拡張に対応
    • オンプレ環境へのマウントも可能
      • AWS Direct Connectを利用してAmazon VPCに接続している必要がある
    • 利用者によるメンテナンスが不要なフルマネージドサービス
    • 高スループットとIOPS、低レンテンシーを提供できるよう設計
    • オブジェクトを複数AZへ自動的に冗長保存
    • 複数インスタンス間での共有が可能
      • NFSv4.1プロトコルを介したマウント
      • 数千のEC2インスタンスからの同時アクセスに対応
    • 想定されるユースケース
      • エンタープライズアプリケーション
      • ビッグデータと分析
      • 動画編集におけるサウンド処理やレンダリングなどのメディアワークフロー
      • 組織における共有ストレージ
      • コンテンツ管理やWeb配信
      • DBのバックアップ
      • ソフトウェア開発用ツール
      • コンテナストレージなど

    Amazon Elastic Block Storage(Amazon EBS)

    • Amazon EC2と組み合わせて利用する永続的なブロックストレージボリューム
    • SLA99.99%
    • 特性の異なる5タイプのストレージが提供されている
      • Amazon EBS汎用(gp2)ボリューム(SSD-backed)
      • Amazon EBSプロビジョンドIOPS(io1)ボリューム(SSD-backed)
      • スループット最適化HDD(st1)ボリューム(HDD-backed)
      • Cold HDD(sc1)ボリューム(HDD-backed)
      • Amazon EBS マグネティック(旧世代のHDD)ボリューム
    • スナップショット機能の提供
      • Amazon S3に増分を保存
      • スナップショットは他のリージョンへコピーが可能
    • Amazon EC2インスタンスをEBS最適化インスタンスとして起動可能
      • EC2インスタンスとEBSボリューム間で専有スループットを利用
      • 他のトラフィックによる影響を低減し、パフォーマンスを最大化
    • Amazon EBS暗号化サービスとIAMによる保護
      • EBSデータボリューム、ブートボリューム、スナップショットの暗号化
      • IAMによるEBSボリュームへのアクセスコントロール
    • 想定されるユースケース
      • 大規模DB
      • エンタープライズアプリケーション
      • 開発やテスト環境
      • プロビジョンドIOPSをNoSQLで活用
      • 事業継続の一環とした定期的なバックアップ

    Amazon Glacier

    • データのアーカイブや長期保存向けのデータストレージサービス
      • アクセス頻度は少ないが必要な時には確実にアクセスしたいデータなど
    • 99.999999999%の耐久性となるよう設計
    • 保存データ容量は無制限
    • Amazon S3と比較しておよそ1/3の料金
      • リアルタイムなデータアクセスは行えない
      • データの取り出しには数時間規模の時間を要する
    • SEC Rule 17a-4、PCI-DSS、HIPAA/HITECH、FedRAMP、EU データ保護指令、FISMAといったセキュリティ標準やコンプライアンス認証をサポート
    • S3側で指定期間を過ぎたデータを自動的にGlacierへ移動させる機能が提供されている
    • アーカイブ内から必要なデータのサブセットだけを取得することが可能
    • 想定されるユースケース
      • 動画やニュース映像などメディアアセットの保管、保全
      • 研究データのアーカイブ
      • 医療システムによる診療データの保管、保全
      • 書類、書籍などのデジタル保管、保全
      • コンプライアンス対応としてのアーカイブ
      • オンプレ環境における磁気テープ装置の代替

    AWS Storage Gateway

    • オンプレアプリケーションからAWSクラウドストレージを利用可能にするハイブリッドストレージサービス
    • NFSやiSCSIなどの標準ストレージプロトコルに対応
      • ファイルストレージとしての接続
      • 仮想テープライブラリとしての接続
      • ブロックストレージとしての接続など

    まとめ

    ひとまとめにクラウドストレージと言っても、様々な特性があることが改めて理解できました。保存データのライフサイクルとコスト管理についても、しっかりと中長期計画を立てて利用をしていくのが良いと感じました。
    また、クラウドでの利用に限定されておらず、既存のオンプレ環境の拡張的な利用が可能となる仕組みが提供されているのも魅力のひとつだと思います。