この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
re:Invent 2017 KeynoteにてGlacier Selectが発表されました。速報をお届けします。
参考:S3 Select and Glacier Select – Retrieving Subsets of Objects | AWS News Blog
__ (祭) ∧ ∧ Y ( ゚Д゚) Φ[_ソ__y_l〉 Glacierダワッショイ |_|_| し'´J
特徴
- 標準的なSQLを利用して、Glacierオブジェクトを取得し、アクセスが可能
- 利用コストは以下の3点できまる
- GB of Data Scanned
- GB of Data Returned
- Select Requests
- クエリスピードによって、値段が変わる
- 全てのリージョンで利用可能
コード例
import boto3
glacier = boto3.client("glacier")
jobParameters = {
"Type": "select", "ArchiveId": "ID",
"Tier": "Expedited",
"SelectParameters": {
"InputSerialization": {"csv": {}},
"ExpressionType": "SQL",
"Expression": "SELECT * FROM archive WHERE _5='498960'",
"OutputSerialization": {
"csv": {}
}
},
"OutputLocation": {
"S3": {"BucketName": "glacier-select-output", "Prefix": "1"}
}
}
濱田の感想
同じタイミングで、S3 Selectも発表されていますが、Glacierは、そもそも、S3データのうち、アクセスが少なくかつ大量のデータをアーカイブ状態にして格納しておくサービスとして存在していました。そのため、S3に保持するより安価なのですが、データにアクセスするときには、復元するためにある程度の時間(3〜4時間)が必要となり、コストとアクセス時の利便性で使い分けていたサービスといえます。
それが、このGlacier Selectの登場により、そのユースケースを完全に覆すような利便性をGlacierにもたらしてくれる可能性があります。
実際に、コスト面やパフォーマンスを検証しないと最終判断はできませんが、アーカイブストレージの活用方法としての幅が広がり、非常に未来を感じさせます。
S3 Selectと合わせて、目が離せませんね。こちらのURLからプレビューの申込が可能です。
それでは、今日はこのへんで。濱田でした。