Amazon WorkDocs のバックアップ構築の必要性について考察してみた

2022.12.14

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、yagiです。

re:Inventが終わり、ドイツに戻りしばらく経ちましたが毎日が寒いです!

朝方の気温は連日マイナスを記録しており、ちょっと外に出ると冷蔵庫の中を歩いているような気分になります。

本日は、Amazon WorkDocs のバックアップについて調べましたので、内容について紹介したいと思います。

Amazon WorkDocs とは

Amazon WorkDocs はコンテンツの作成、ストレージ、コラボレーション用の安全なフルマネージド型サービスです。Amazon WorkDocs を使用すると、コンテンツの作成、編集、共有が簡単になります。また、AWS 内に一元管理で格納されるため、どこからでも、どんなデバイスからでもアクセスできます。Amazon WorkDocs では他のユーザーとのコラボレーションが容易になり、コンテンツ共有、豊富なフィードバックのやりとり、文書の共同編集を簡単に行えます。また、Amazon WorkDocs を使用してファイル共有をクラウドに移行することにより、古いファイル共有インフラストラクチャを不使用にすることができます。Amazon WorkDocs はお客様の既存システムと統合可能なうえ、豊富な API が利用できるため、独自のリッチなコンテンツを持つアプリケーションの開発が実現できます。Amazon WorkDocs は AWS 上にビルドされるため、お客様のコンテンツは世界最大のクラウドインフラストラクチャで保護されます。

Amazon WorkDocs に前払いや義務的条件はありません。アクティブなユーザーアカウントおよびストレージ使用量に対する従量制料金のみです。

Amazon WorkDocs

また、Amazon WorkSpacesをご利用中のお客様は、追加料金なしで WorkDocs へのアクセス権限が付与され、WorkSpaces の 1 ユーザー様につき 50 GB のストレージが無料で含まれています。割引料金で 1 TB のストレージを使用できるアップグレードも利用可能となっています。

Amazon WorkSpaces をご利用になるお客様向けの Amazon WorkDocs の料金

Amazon WorkDocs のバックアップについて考察する

Amazon WorkDocs のバックアップ機能について確認したところ、現在は削除されていることが明らかとなりました。

Document history

Amazon WorkDocs Backup

Removed the Amazon WorkDocs Backup documentation from the Amazon WorkDocs Administration Guide because the component is no longer supported.

June 24, 2021

上記の通り、2021/6/24の更新履歴で、Amazon WorkDocs Backupのコンポーネントがサポート外となることが記載されています。

Amazon WorkDocs の基本

Amazon WorkDocs の基本の使い方については、以下の弊社記事をご覧ください。

Amazon WorkDocsの基本をまとめてみた

上記のブログ中にもありますが、Amazon WorkDocs ではドキュメントのバージョン管理が可能です。必要に応じて古いバージョンのドキュメントを参照できます。

また、ファイルを削除すると、ゴミ箱へ移行され、30日後に復元箱へ移行されます。復元箱ではデフォルト値で60日間(最大365日間まで変更可能)保存された後に削除されます。削除される前であれば、復元が可能となります。

Amazon WorkDocs の耐久性

Amazon WorkDocs のレジリエンス(耐久性)については、以下のドキュメントに記載がありました。

AWS グローバル インフラストラクチャは、AWS リージョンとアベイラビリティー ゾーンを中心に構築されています。AWS リージョンは、物理的に分離された複数のアベイラビリティーゾーンを提供します。これらは、低レイテンシー、高スループット、および高度に冗長なネットワークで接続されています。アベイラビリティ ゾーンを使用すると、中断することなくアベイラビリティ ゾーン間で自動的にフェイルオーバーするアプリケーションとデータベースを設計および運用できます。アベイラビリティ ゾーンは、従来の単一または複数のデータ センター インフラストラクチャよりも可用性が高く、フォールト トレラントで、スケーラブルです。

Resilience in Amazon WorkDocs - Amazon WorkDocs

また、FAQには以下の記載がありました。

Q.Amazon WorkDocs ではファイルはどこに保存されますか? また、ファイルは安全ですか?

Amazon WorkDocs は、完全マネージド型のサービスです。ファイルは、ミッションクリティカルなデータが失われないように設計された AWS の高い耐久性のストレージインフラストラクチャを使用して保存されます。> Amazon WorkDocs に保存されているすべてのファイルとコメントは暗号化されています。

Amazon WorkDocs のよくある質問 - セキュリティ

上記より、バックアップについて特段の実装がなくとも、ミッションクリティカルなデータが失われないような十分な耐久性があることがわかります。

ゴミ箱や復元箱に保存されたファイルについての耐久性はどうか

この点については、記載されたドキュメントが見当たらないため、AWSサポートへ質問してみました。

大変恐れ入りますが、Amazon WorkDocs サービスに移行されたデータがどのように保存されるかについて、そのアーキテクチャの詳細については、公開しておりません。

一方で、Amazon WorkDocs サービスに移行されたデータは、お客様のミッションクリティカルなデータが失われないように設計された AWS の高い耐久性のストレージインフラストラクチャを使用して保存されます。

ゴミ箱、復元箱についても AWS の高い耐久性のストレージインフラストラクチャを使用しております。

Amazon WorkDocsに移行されたデータの保存について、アーキテクチャの詳細は公開されていないものの、ゴミ箱、復元箱についても高い耐久性のストレージが使用されるとのことでした。

以上から、削除してゴミ箱に移動し、さらに復元箱に移動したファイルやフォルダについても、復元箱へ移動してから最大365日まで高い耐久性で保存されることがわかりました。

バックアップの構築自体は可能なのか

今までの確認事項から、バックアップを構築しなくても、十分な耐久性があることがわかります。

ただし、他の要件でやはりバックアップが必要となった場合に、バックアップを構築すること自体は可能です。

S3へバックアップを構築する方法について、以下の記事に記載されていましたので共有します。

Automatically sync files from Amazon WorkDocs to Amazon S3

WorkDocsサイトのバックアップを取得する方法について

上記は、AWS LambdaでPythonモジュールを使い、Amazon WorkDocs から Amazon S3 にファイルを自動的に同期する方法となっています。 (Amazon SQS キューを使用して、Amazon WorkDocs ファイルを Amazon S3 に同期中にエラーが発生した場合に API イベントを再処理しています)

感想

Amazon WorkDocs のバックアップについて考察してみました。

バックアップ機能は現在サポート外となっていますが、バックアップの必要性がないほどに耐久性に優れたストレージインフラストラクチャを使用して保存され、旧バージョンのファイルやゴミ箱、復元箱についても同様の耐久性が適用されます。

また必要に応じS3へバックアップを取得する方法も公開されています。

このようなファイル共有ストレージは、ついバックアップありきで考えてしまうのですが、それすら必要ないほど高い耐久性で保存される、というのはとてもありがたいと感じました。

以上です。