【速報】Glacierにクエリを投げることができるGlacier Selectが発表されました!! #reinvent

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

re:Invent 2017 KeynoteにてGlacier Selectが発表されました。速報をお届けします。

参考:S3 Select and Glacier Select – Retrieving Subsets of Objects | AWS News Blog

 __
(祭) ∧ ∧
 Y  ( ゚Д゚)
 Φ[_ソ__y_l〉      Glacierダワッショイ
    |_|_|
    し'´J

特徴

  • 標準的なSQLを利用して、Glacierオブジェクトを取得し、アクセスが可能
  • 利用コストは以下の3点できまる
    • GB of Data Scanned
    • GB of Data Returned
    • Select Requests
  • クエリスピードによって、値段が変わる
  • 全てのリージョンで利用可能

コード例

import boto3
glacier = boto3.client("glacier")

jobParameters = {
    "Type": "select", "ArchiveId": "ID",
    "Tier": "Expedited",
    "SelectParameters": {
        "InputSerialization": {"csv": {}},
        "ExpressionType": "SQL",
        "Expression": "SELECT * FROM archive WHERE _5='498960'",
        "OutputSerialization": {
            "csv": {}
        }
    },
    "OutputLocation": {
        "S3": {"BucketName": "glacier-select-output", "Prefix": "1"}
    }
}

濱田の感想

同じタイミングで、S3 Selectも発表されていますが、Glacierは、そもそも、S3データのうち、アクセスが少なくかつ大量のデータをアーカイブ状態にして格納しておくサービスとして存在していました。そのため、S3に保持するより安価なのですが、データにアクセスするときには、復元するためにある程度の時間(3〜4時間)が必要となり、コストとアクセス時の利便性で使い分けていたサービスといえます。

それが、このGlacier Selectの登場により、そのユースケースを完全に覆すような利便性をGlacierにもたらしてくれる可能性があります。

実際に、コスト面やパフォーマンスを検証しないと最終判断はできませんが、アーカイブストレージの活用方法としての幅が広がり、非常に未来を感じさせます。

S3 Selectと合わせて、目が離せませんね。こちらのURLからプレビューの申込が可能です。

Amazon S3 Select Preview

それでは、今日はこのへんで。濱田でした。