GPU メモリを分割して低コストに使える  G6f インスタンスが登場しました

GPU メモリを分割して低コストに使える G6f インスタンスが登場しました

たったひとつの GPU を分割、見た目は 1/8 の GPU メモリ、価格は 1/3、その名は g6f.xlarge!
2025.12.27

はじめに

AWS 初の fractional GPU インスタンス G6f が利用可能になりました。2025 年 7 月のアップデートを遅れて紹介します。

従来の GPU インスタンスは GPU を 1 機以上搭載するためコストも高く、小規模ワークロードには過剰なときもありました。G6f インスタンスは GPU のメモリを仮想 GPU(vGPU) として分割して利用できる新しいインスタンスタイプです。 NVIDIA L4 Tensor Core GPU を最小 1/8(3GB メモリ)まで分割したインスタンスを起動できます。そのため、小規模な GPU ワークロードではより安価に GPU インスタンス利用できます。

https://aws.amazon.com/jp/about-aws/whats-new/2025/07/amazon-ec2-g6f-instances-fractional-gpus/

https://aws.amazon.com/jp/about-aws/whats-new/2025/11/amazon-ec2-g6f-instances-additional-regions/

いつ使うの?

思いつくところのユースケースですと以下になります。NVIDIA GRID ドライバーのインストールが必須のため、主に Amazon DCV などを使用して接続する仮想デスクトップ用途を想定しているものと思われます。

  • CAD などの 3D モデルを見て動かすワークテーション用途
  • 小規模な機械学習推論
  • 軽量なグラフィックレンダリング
  • 開発・テスト環境での GPU 利用

GPU メモリを多く必要とするワークロードでは従来の G6 を選択した方がお得です。小規模なワークロードで GPU メモリを小さくして構わないから GPU を使いたいたときには G6f が最適です。

G6f インスタンスのスペック

G6f インスタンスは 4 つのインスタンスサイズと、メモリが多いタイプ 1 つを追加した合計 5 種類あります。東京リージョン(ap-northeast-1)でのオンデマンド価格も併せて掲載します。※ 2025/12/27 時点の価格です。

インスタンスタイプ GPU 割当 GPU メモリ vCPU メモリ 時間単価(USD) 月額換算(USD)
g6f.large 1/8 3 GiB 2 8 GiB $0.293 $213
g6f.xlarge 1/8 3 GiB 4 16 GiB $0.3444 $251
g6f.2xlarge 1/4 6 GiB 8 32 GiB $0.6889 $502
g6f.4xlarge 1/2 12 GiB 16 64 GiB $1.3778 $1,005
gr6f.4xlarge 1/2 12 GiB 16 128 GiB $1.546 $1,128

※月額換算は 730 時間で計算しています。

GPU

ベースの G6 インスタンスと同じく NVIDIA L4 Tensor Core GPU が搭載されています。

https://www.nvidia.com/ja-jp/data-center/l4/

CPU

AMD EPYC 7R13(第 3 世代)を搭載しています。M6a インスタンスと同じプロセッサです。

https://dev.classmethod.jp/articles/new-m6a-amd-epic-ec2/

/proc/cpuinfo の出力結果
ubuntu@ip-10-0-0-108:~$ cat /proc/cpuinfo
processor	: 0
vendor_id	: AuthenticAMD
cpu family	: 25
model		: 1
model name	: AMD EPYC 7R13 Processor
stepping	: 1
microcode	: 0xa0011de
cpu MHz		: 2626.145
cache size	: 512 KB
physical id	: 0
siblings	: 2
core id		: 0
cpu cores	: 1
apicid		: 0
initial apicid	: 0
fpu		: yes
fpu_exception	: yes
cpuid level	: 16
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid extd_apicid aperfmperf tsc_known_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand hypervisor lahf_lm cmp_legacy cr8_legacy abm sse4a misalignsse 3dnowprefetch topoext ssbd ibrs ibpb stibp vmmcall fsgsbase bmi1 avx2 smep bmi2 invpcid rdseed adx smap clflushopt clwb sha_ni xsaveopt xsavec xgetbv1 clzero xsaveerptr rdpru wbnoinvd arat npt nrip_save vaes vpclmulqdq rdpid
bugs		: sysret_ss_attrs spectre_v1 spectre_v2 spec_store_bypass srso ibpb_no_ret tsa
bogomips	: 5299.99
TLB size	: 2560 4K pages
clflush size	: 64
cache_alignment	: 64
address sizes	: 48 bits physical, 48 bits virtual
power management:

processor	: 1
vendor_id	: AuthenticAMD
cpu family	: 25
model		: 1
model name	: AMD EPYC 7R13 Processor
stepping	: 1
microcode	: 0xa0011de
cpu MHz		: 1374.343
cache size	: 512 KB
physical id	: 0
siblings	: 2
core id		: 0
cpu cores	: 1
apicid		: 1
initial apicid	: 1
fpu		: yes
fpu_exception	: yes
cpuid level	: 16
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid extd_apicid aperfmperf tsc_known_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand hypervisor lahf_lm cmp_legacy cr8_legacy abm sse4a misalignsse 3dnowprefetch topoext ssbd ibrs ibpb stibp vmmcall fsgsbase bmi1 avx2 smep bmi2 invpcid rdseed adx smap clflushopt clwb sha_ni xsaveopt xsavec xgetbv1 clzero xsaveerptr rdpru wbnoinvd arat npt nrip_save vaes vpclmulqdq rdpid
bugs		: sysret_ss_attrs spectre_v1 spectre_v2 spec_store_bypass srso ibpb_no_ret tsa
bogomips	: 5299.99
TLB size	: 2560 4K pages
clflush size	: 64
cache_alignment	: 64
address sizes	: 48 bits physical, 48 bits virtual
power management:

気になる G6 との価格比較

G6f と G6 のコストパフォーマンスを比較します。同じ vCPU 数の g6f.xlarge と g6.xlarge で比較すると以下のようになります。

インスタンスタイプ GPU 割当 GPU メモリ vCPU メモリ 時間単価(USD) 月額換算(USD)
g6f.xlarge 1/8 3 GiB 4 16 GiB $0.3444 $251
g6.xlarge 1(基準) 24 GiB 4 16 GiB $1.167 $852

※月額換算は 730 時間で計算しています。

コストパフォーマンスは如何に?

g6f.xlarge は g6.xlarge と比較すると約 1/3 の価格で 1/8 の GPU を利用できることになります。

vCPU 数とメモリが同じ構成で GPU だけを小規模に使いたい場合には最適ですね。

使ってみた

g6f.large インスタンスを起動して GPU のスペックを確認しました。

検証環境

  • リージョン:ap-northeast-1(東京)
  • インスタンスタイプ:g6f.large
  • OS:Ubuntu 24.04 LTS
  • NVIDIA GRID ドライバー:インストール済み

GRID ドライバーのインストール方法は以前の記事を参照してください。

https://dev.classmethod.jp/articles/ubuntu-24-04-nvidia-grid-driver-install/

GPU の確認

nvidia-smi コマンドでの基本確認

nvidia-smi コマンドで GPU の情報を確認します。

GPU 名の NVIDIA L4-3Q という名前は vGPU プロファイル名です。GPU メモリは 3072 MiB(3 GB)に制限されています。

$ nvidia-smi
Sat Dec 27 01:36:39 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.105.08             Driver Version: 580.105.08     CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA L4-3Q                   On  |   00000000:31:00.0 Off |                    0 |
| N/A   N/A    P0            N/A  /  N/A  |       0MiB /   3072MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

GPU の詳細情報確認

nvidia-smi -q コマンドで詳細情報を確認します。

nvidia-smi -q

出力が非常に長いため、主要な情報を抜粋して紹介します。

GPU UUID と PCI バス情報

GPU Virtualization Mode が VGPU となっており、仮想 GPU によってメモリを分割しています。また、Product Brand が NVIDIA RTX Virtual Workstation となっており、仮想ワークステーション向けの GPU として動作していることがわかります。

GPU 00000000:31:00.0
    Product Name                      : NVIDIA L4-3Q
    Product Brand                     : NVIDIA RTX Virtual Workstation
    Product Architecture              : Ada Lovelace
    GPU UUID                          : GPU-fc738ed2-e2c3-11f0-a0f0-6ae6b3f8ea6b
    Bus Id                            : 00000000:31:00.0
    GPU Virtualization Mode
        Virtualization Mode           : VGPU
    vGPU Software Licensed Product
        Product Name                  : NVIDIA RTX Virtual Workstation
        License Status                : Licensed (Expiry: N/A)

GPU メモリ情報

合計 3072 MiB の GPU メモリが割り当てられています。システムによって 664 MiB が予約され、実際に使用可能なメモリは 2409 MiB(約 2.4 GB)です。

FB Memory Usage
    Total                             : 3072 MiB
    Reserved                          : 664 MiB
    Used                              : 0 MiB
    Free                              : 2409 MiB
BAR1 Memory Usage
    Total                             : 256 MiB
    Used                              : 0 MiB
    Free                              : 256 MiB

まとめ

Amazon EC2 G6f インスタンスは GPU を分割して利用できる新しいインスタンスタイプでした。

  • NVIDIA L4 Tensor Core GPU を最小 1/8 に分割
  • 小規模ワークロードでコスト効率が高い

GPU メモリを多く必要とするワークロードでは従来の G6 を選択し、小規模なワークロードには G6f を選択することで、コストを最適化できます。

おわりに

2025 年 7 月のアップデートなのですが手が空かなく後回しにしていたら年末になってしまいました。

参考資料

この記事をシェアする

FacebookHatena blogX

関連記事