AI動画生成の「FramePack」をEC2上に構築して使ってみた

AI動画生成の「FramePack」をEC2上に構築して使ってみた

Clock Icon2025.04.21

こんにちは、ゲームソリューション部のsoraです。
今回は、AI動画生成の「FramePack」をEC2上に構築して使ってみたことについて書いていきます。

前提

  • EC2でG系インスタンスを使用するため、クォータの引き上げは実施済みであること

EC2の起動

まずEC2インスタンスを起動します。
使用するAMIは、Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.6.0 (Amazon Linux 2023)です。
インスタンスタイプはg6.xlarge、EBSは100GiBにします。

FramePackのインストール

以下リポジトリからFramePackをインストールします。
https://github.com/lllyasviel/FramePack.git

Python3.10が推奨されていましたが、デフォルトで入っていたPython3.12で実行しました。

$ python -V
Python 3.12.6

$ git clone https://github.com/lllyasviel/FramePack.git
$ cd FramePack
$ pip install -r requirements.txt

準備ができたため実行します。
実行時にはモデルのインストールも行われます。
30GB以上のモデルをインストールするため、EBSは100GiBにしています。

$ python demo_gradio.py --server 0.0.0.0
………
* Running on local URL:  http://0.0.0.0:7860

起動後に{EC2のIPアドレス}:7860にアクセスすると、FramePackの画面が表示されました。
sr-framepack-01

動画生成

起動ができたため動画生成をしてみます。
Imageをドラッグアンドドロップでアップロードして、プロンプトを入力して実行します。

入力した画像は以下です。
sr-framepack-02
プロンプトは以下です。
A kitten and a duck playing.

生成された動画は以下です。(mp4で生成後に、別ツールでgif変換したため画質が若干荒くなっています)
sr-framepack-03

設定はデフォルトのままで、25ステップで5秒の動画生成で実行しました。
20分ぐらいでFinished Framesに1秒程度の動画が表示され、これが5秒なので5回繰り返されると思います。
そのため、5秒の動画だと単純計算で1時間20分程度かかることになると思います。
今回は時間がかかりそうだったため、End Generationを押して途中で終了しました。

生成された動画は、Finished Framesの右上のボタンからダウンロードが可能です。
サーバー上では以下にアップロードした画像と生成された動画が配置されています。

$ pwd
/home/ec2-user/FramePack/outputs
$ ls
250421_061119_689_1346.png  250421_061119_689_1346_18.mp4  250421_061119_689_1346_9.mp4

設定値について

設定値についてみていきます。
sr-framepack-04

  • Faster speed, but often makes hands and fingers slightly worse.
    • 速度を速くするかどうか
    • 手や指の出来が少し悪くなることが多いとのことです。
  • Seed
    • シード値
  • Total Video Length (Seconds)
    • 動画の合計長さ(秒)
    • 同じ画像に対して長く設定するかどうかは置いておいて、120秒まで設定できるのはすごいですね。
  • Steps
    • 動画生成時のステップ数
    • 1秒あたりこのステップ数かかります。
    • この値を変更するのは推奨されていません。
  • Distilled CFG Scale
    • Distilled CFGスケール
    • プロンプトに対してどの程度忠実に生成するかを決めるパラメータ
    • 値が大きいほど忠実に生成され、小さいほどプロンプトにあまり縛られずに自由な生成がされる。
    • この値も変更するのは推奨されていません。
  • GPU Inference Preserved Memory (GB) (larger means slower)
    • GPU推論用確保メモリ(GB)
    • 値が大きいほど生成に時間がかかるみたいです。
    • OOM(アウトオブメモリ)が発生した場合はこの値を大きくしてください。
  • MP4 Compression
    • MP4圧縮
    • 数値が小さいほど高画質で、0は無圧縮
    • 黒い映像が出る場合は16にしてみてください。

最後に

今回は、AI動画生成の「FramePack」をEC2上に構築して使ってみたことを記事にしました。
どなたかの参考になると幸いです。

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.