生成AI基礎1日コースを受けて研修のメモを生成AIにまとめさせてみた
概要
こんにちは、クラスメソッド製造ビジネステクノロジー部の田中聖也です
クラスメソッドが提供しているAWSトレーニングの生成AI基礎1日コースを受けてきました!!
クラスメソッドにjoinする前は生成AIをほとんど使ったことがなかったので「キャッチアップせねば!!」という思いで受けました
せっかく、生成AIの研修を受けたので研修中に取った手書きメモを写真にとってAI-Starterを使用して研修の内容をまとめさせてみました(もちろん、自分で軽く修正は入れています)
研修内容のメモ
AWSの生成AIコースを初めて受講した感想
2023年3月18日に「Generative AI Essential on AWS」コースを受講しました。初めての生成AIコースで、非常に多くのことを学びました。以下にその内容をまとめます。
生成AIの基本情報
生成AIについて学び始めたとき、まずそのすごさに感動しました。生成AIは人工知能(AI)、機械学習、ディープラーニングの進化形であり、非常に高度な技術です。
生成AIの課題
生成AIにはいくつかの課題が存在します。以下はその主な課題です
- ハルシネーション: 虚偽の情報を生成してしまうことがあります。
- 知財問題や著作権: 生成されたコンテンツが著作権を侵害する可能性があります。
- データのバイアス: 偏ったデータを使用すると、公平性に問題が生じます。
- 解釈可能性: 出力の理解が難しいことがあります。
- 倫理と意思決定: 生成AIがどのように意思決定を行うかについての倫理的な問題があります。
基盤モデル(Foundation Model)
生成AIの基盤モデル(Foundation Model)は、様々なタスクに応用可能な機械学習モデルです。このモデルを学習して様々なタスクに応用できることが非常に魅力的です。
生成AIの基本動作
生成AIの基本動作についても学びました。以下はその主なポイントです
- トークン: 単語の区切りとして使用されます。
- 埋め込みとベクトル化(Embedding): 意味を理解するために使用されます。
Amazon Bedrock
Amazon Bedrockは静的トレーニング済みモデルを提供しており、LlamaなどのOSSを使った追加トレーニングが可能です。スケーラブルでコストが低いAWSの利点を活用できます。
生成AIのユースケース
生成AIのユースケースについても学びました。生成AIは万能ではなく、得意・不得意があることを理解しました。
生成AIが向かないケース
生成AIが向かないケースも存在します。以下はその主なポイントです
- 高い精度と信頼性が重要な場合
- 設計可能性と透明性が必要な場合
- 問題の定義が不明確な場合
- データの質が悪い場合
- ROIが悪い場合
- 倫理上の問題がある場合
プロンプトデザインのベストプラクティス
プロンプトデザインのベストプラクティスについても学びました。以下はその主なポイントです
- ロール(役割): 具体的な役割を設定する。
- タスク(指示): 具体的な指示を与える。
- 出力: 期待する出力を明確にする。
具体的な指示をすることで、より精度の高い回答を得ることができます。
その他の技術と手法
以下の技術と手法についても学びました!
- Zero-shotとFew-shot: 入力に対して回答を生成する方法。
- RAG(Retrieval-Augmented Generation): 検索システムと生成言語モデルの組み合わせ。
- 非構造化データの使用: PDFや画像などの非構造化データを使用する方法。
- Tool-useプロンプト: AIエージェントの形成。
- Action-orientedプロンプト: アクション指向のプロンプト。
- Chain-of-thought: 段階的アプローチ。
- Tree-of-thought: 複数の考えを評価する方法。
生成AIの原則と考慮事項
生成AIの原則と考慮事項についても学びました。以下はその主なポイントです
- 倫理的、安全、偏りのない設計・開発方法: 信頼と評価の向上、規制コンプライアンスの確保、リスクの軽減、競争上の優位性向上。
- 公平性: 偏りがないこと。
- 説明可能性: 決定理由の説明。
- 透明性: プライバシーとセキュリティ。
- 正確性と堅牢性: データの正確性と堅牢性。
- ガバナンス: 管理と統制。
- 安全性: 人に害を与えないこと。
- 制御性: AIのシステムを人間の価値に合わせること。
対処すべきバイアス
生成AIにおけるバイアスの対処法についても学びました。以下はその主なポイントです
- データバイアス
- アルゴリズムバイアス
- インタラクションバイアス
- バイアス緩和
バイアスの緩和に向けたAWSサービスとして、以下が挙げられます
- 透明性: AIサービスカード、SageMakerモデルカード
- 説明可能性: SageMaker Clarify、SageMaker Autopilot
セキュリティ
生成AIにおけるセキュリティについても学びました。LLMの脆弱性、プロンプトインジェクション、トレイニングデータのポイズニングなどが主なリスクです。
データガバナンスとコンプライアンス
データガバナンスとコンプライアンスについても学びました。以下はその主なポイントです
- データガバナンス: データのアーカイブの期間など。
- コンプライアンス: NIST、ENISA、PCI DSSの規格に対応する必要性。
生成AIのアプリのライフサイクル
生成AIのアプリのライフサイクルについても学びました。以下はその主なポイントです
- コースデータ準備: 非構造化データの活用、組成作業。
- 基盤モデルの構築: コスト。
- パフォーマンス改善: ファインチューニング、RAG。
- 結果評価: ROUGE、BLEU、BERTScore。
- デプロイ: ガードレール、モデルカード、ヒューマンレビュー。
結論
AWSの生成AIコースを初めて受講して、多くのことを学びました。生成AIの技術的な側面、課題、応用例、向かないケース、プロンプトデザインのベストプラクティス、その他の関連技術と手法、そして生成AIの原則と考慮事項についての理解を深めることができました。これからも生成AIの学習を続けていきたいと思います。