まるクラ勉強会で「AWS ParallelClusterとTrainiumを使って大規模言語モデルをトレーニングする入門」というタイトルで登壇しました
2024.11.13
こんちには。
データ事業本部 インテグレーション部 機械学習チームの中村( @nokomoro3 )です。
「まるクラ勉強会 ONLINE #03 - AWS・Google Cloudを活用した機械学習 -」で登壇しましたのでその資料やリンクを共有いたします。
ご参加いただいた皆様、ありがとうございました!
登壇資料
スライドの中で紹介したリンク
以下が登壇にあたって、読んだ文献として紹介したリンクです。
基本的な使い方は?
- GUIでクラスタを管理するには
- クラスタ設定の詳細
- slurmコマンドの詳細
どうやって大規模言語モデル向けに使う?
- Neuronのセットアップ方法
- TGI: Text Generation Inferenceとは
何から始めたら良い?
- 公式ワークショップ
- Neuron SDKを使った学習・推論も試してみよう
- NVIDIAのGPU含む分散学習まとめレポジトリ
さいごに
本登壇が皆様のご参考になれば幸いです。