DataSync の転送速度を算出すると物理的な帯域速度より大きくなる理由を教えてください

2021.09.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

困っていた内容

DataSync によるオンプレミスデータのバックアップを検討しています。性能テストを実施したのですが、転送量と転送時間から転送速度を算出すると、契約しているインターネット回線の帯域速度(100Mbps)より大きな値となりました。
自動的に圧縮して転送しているとかであれば良いのですが、そのようなことはあるのでしょうか。

どう対応すればいいの?

圧縮を含むネットワーク最適化が実施されます。

DataSync ではインクリメンタル転送、インライン圧縮、スパースファイル検出を備えた専用ネットワークプロトコルによるネットワーク最適化が実施されます。そのため、単純に転送量と転送時間から転送速度を算出すると、物理的な帯域速度より大きくなる場合がございます。

なお、ゼロパディングされたデータをテストに使用すると、実際のデータとはネットワーク最適化の効果に大きな差が発生する場合がありますので、ご注意ください。

また、インターネット回線の帯域幅占有を懸念される場合は、タスク設定により DataSync が使用するネットワーク帯域幅を制限できますので、ご検討ください。

参考資料

特徴 - AWS DataSync | AWS

専用ネットワークプロトコル

このサービスは、ストレージプロトコルと疎結合化された AWS 設計の転送プロトコルを使用して、データの移動を加速しています。このプロトコルは、どのようにして、いつ、どのようなデータをネットワークを介して送信するかを最適化します。DataSync によって実行されるネットワーク最適化には、インクリメンタル転送、インライン圧縮、スパースファイル検出、ならびにインラインデータ検証や暗号化などがあります。