[レポート]SageMakerでのHugging Faceの活用について学ぶ #BOA304 #reinvent

2022.11.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データアナリティクス事業本部の鈴木です。

BOA304の『Building a product review classifier with transfer learning』を聴講したのでレポートです。

セッションについて

登壇者

  • Banjo Obayomi, Senior Developer Advocate, AWS
  • James Yi, Partner Solutions Architect, AWS

Session level

300 - Advanced

Session type

Breakout Session

動画

(2022/12/16追記)

セッション概要

Hugging Faceの事前学習済みモデルを転移学習することにより、テキストの分類からテキストの要約まで、様々なNLPタスクに特化したモデルを構築することができます。このセッションでは、テキストを元にした製品レビュー分類器を構築するために、AWSとHugging Faceをどのように使用できるか紹介されました。

発表概要

Hugging Faceについては、モデルの訓練・評価・テストとHugging Face Hubの紹介がありました。

Hugging Face1

Hugging Face2

Hugging Face3

Hugging Face4

SageMakerについては、特に分散トレーニングと推論エンドポイントに注目して紹介されていました。Hugging Faceで扱うようなNLPモデルで大規模な計算リソースが必要なことをやりたい場合、学習時には分散トレーニングができると非常に便利で、実現可能なことが大きく広がります。

SageMaker1

SageMaker2

SageMaker3

発表の要約です。

要約

リファレンスの文献について

レポートの最後にリファレンスとして紹介されていた文献について、リンクを記載します。

Amazon SageMakerとHugging Faceを合わせて使うときに参考になるドキュメントです。

  1. banjtheman/distilbert-base-uncased-helpful-amazon · Hugging Face
  2. notebooks/sagemaker at main · huggingface/notebooks
  3. Hugging Face on Amazon SageMaker
  4. Use Hugging Face with Amazon SageMaker - Amazon SageMaker

例えば2番目のURLで紹介されているレポジトリでは、Huggingface Sagemaker-sdk - Getting Started Demoとして、sagemaker.huggingfaceAPIの利用例が紹介されています。

3番目のURLのHugging Faceのドキュメントでは、Hugging FaceをSageMaker上で実行する際の特徴やメリット、またさまざまな関連ドキュメントが整理されています。2番目のレポジトリへのリンクもあるので、ご興味のある方は、まずはここから読むと良いかもしれません。

最後に

BOA304では、SageMakerをコンピューティングに使ってどのようにHugging Faceのモデルを実行できるか学ぶことができました。

SageMakerとHugging FaceはDevelopersIOでもよく記事にさせて頂いているので、このセッションを機に組み合わせた内容もご紹介していければと思います!