オンプレミスのデータをDataSyncでAWSに移行するワークショップ(STG318)に参加してきた #reinvent

オンプレミスのデータをDataSyncでAWSに移行するワークショップの概要をお伝えします。
2022.12.01

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

大家好、AWS事業本部の西野です。

オンプレミスのデータをDataSyncでAWSに移行するワークショップ Migrate your on-premises data to AWS storage using AWS DataSync (STG318)に参加してきました。

ワークショップの概要

In this session, learn how to efficiently perform online migration of on-premises data to the cloud. Work hands-on with AWS DataSync to copy data from a simulated on-premises NAS to a variety of cloud targets including Amazon S3 and Amazon FSx for NetApp ONTAP. This workshop covers three broad use cases for online data transfer at scale: analytics processing, archival storage, and data protection. You must bring your laptop to participate

アジェンダ

  • Intro
  • AWS DataSync overview
  • Workshop overview
  • Workshop Imprementation

AWS DataSyncの概要

大容量のデータ移行には以下のような難易度の高いタスクがあるというお話から始まりました。

  • スクリプトの開発やデプロイ
  • データの暗号化と検証
  • エラーからの復旧
  • ネットワークの可用性
  • パフォーマンスの保証

上述の課題を解決する1つの手段になるのがDataSyncです。 数々の特徴によってデータ移行の成功をサポートします。

ワークショップ

ワークショップでは上図の環境を構築し、データ移行を実施しました。流れは下記のとおりです。

  1. DataSyncエージェントのデプロイ
  2. DataSyncエージェントのアクティベート
  3. DataSyncロケーションの作成
  4. DataSyncタスクの実行

※なお、Application serverとOn-premises storageはオンプレミス環境を模したVPCに構築されています。

DataSyncエージェントのデプロイ

DataSyncによるデータ移行には原則としてDataSyncエージェントと呼ばれる仮想マシンが必要です。
ワークショップのガイドにしたがってAMIからDataSyncエージェントをEC2としてデプロイします。

DataSyncエージェントのアクティベート

デプロイしたDataSyncエージェントをDataSyncサービスに認識させる作業を「アクティベート」といいます。
本ワークショップの構成ではDataSyncエージェント用のEC2インスタンスにパブリックIPを持たせているので、当該IPに対してAWSマネジメントコンソールからこの作業を実行します。

DataSyncロケーションの作成

データの送信元や送信先となるストレージのことを「ロケーション」といいます。
既に存在する以下3つのストレージをDataSyncロケーションとして指定します。

  • NFS(先程の図の中のOn-premises storage)
  • S3
  • FSx

DataSyncタスクの実行

ソースとなるNFSからS3およびFSxをディスティネーションとしたDataSyncタスクを作成します。そしてこれを実行すると実際のデータ移行が始まります。

おまけ

途中でDataSyncのステッカーをいただきました。

終わりに

Session level(300 - Advanced)とありましたが、もう少し易しい印象でした。 私のようにDataSyncを初めて触る方におすすめできるワークショップです。

このブログがほんの少しでも世界を良くできれば嬉しいです。
AWS事業本部の西野 (@xiyegen) がお送りしました。