【速報】Inf2インスタンスが発表されました #reInvent

AWS re:Invent 2022

AWS

もこ

2022.11.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

ども、re:Invent現地参加組のもこ@札幌オフィスです。

現在開催中の火曜日のKeynoteで「Inf2 Instance」が発表されました！

Inf2インスタンスの発表！！

会場ではInf2インスタンスが発表されました！！！！今日からプレビュー申込み開始となります。

Inf2は、従来の4倍のスループット、10分の1のレイテンシーを兼ね備えた機械学習推論インスタンスです。

Inf2インスタンスは最大2.3PFlopsのDLパフォーマンス、385GBのアクセラレーターメモリに9.8TB/sのメモリ帯域を備えたインスタンスタイプで、Inf1インスタンスと比較して3倍のコンピューティングパフォーマンス、4倍のアクセラレーターメモリ、4倍のスループット、10分の1のレイテンシとなっており、小規模なモデルの場合は、Inf1よりも優れた価格パフォーマンスで利用できます。

Amazon EC2のGPUインスタンスと比べてワットあたりの効率は最大50%優れたパフォーマンスとなっています。

AWS Neuron SDKを利用する事により、PyTorch, TensorFlow等のML Frameworkと連携して、数行のコードでInf2インスタンスにデプロイする事ができます。