【生成AIプロンプト入門】 画像の使い方

【生成AIプロンプト入門】 画像の使い方

Clock Icon2025.06.25

こんにちは、リテールアプリ共創部の戸田駿太です。

今回は生成AIのプロンプトに画像を使うとできることを3つまとめました。
画像の方がテキストより柔軟に表現できるため色々な活用方法があります。

このブログの生成AIのモデルはClaude Sonnet 4を使用しています。

画像の文字読み取り(文字起こし)

画像で資料を渡されて画像内で書かれている文字をタイピングすることがあると思います。
そんな作業は生成AIにやらせましょう!

タイトルやタグなどの無駄な文字があるものの、名前以外は完璧に読み取れていることがわかります。

画像 AIの出力
alt text 【生成AIプロンプト入門】
Zero-ShotとFew-Shotの使い分け方

【生成AIプロンプト入門】Zero-ShotとFew-Shotの使い分け方

#AI #生成AI #プロンプトエンジニアリング

戸田康太

2025.05.22

こんにちは、リテールアプリ共創部の戸田康太です。

今回は生成AIのテクニックで一番最初に学んでほしい「Zero-Shot」と「Few-Shot」について解説します。

Zero-Shot, Few-Shot プロンプティングとは

プロンプティング手法 説明
Zero-Shot プロンプティング AIに事前の例を示さず、出力をさせる方法
Few-Shot プロンプティング 複数の例を示してから出力をさせる方法

この記事はZero-ShotかFew-Shotを使い分けることができるようになることが目標です。

Zero-Shotの例

Zero-Shotは、例示なしで直接指示を出す方法です。モデルに事前の例を示さず、タスクを実行させます。

プロンプトの例

以下の文章の感情はポジティブですか、ネガティブですか?
「この映画は時間の無駄だった。二度と見たくない。」
実際の文章

こんにちは、リテールアプリ共創部の戸田駿太です。

今回は生成 AI のテクニックで一番最初に学んでほしい「Zero-Shot」と「Few-Shot」について解説します。

Zero-Shot, Few-Shot プロンプティングとは
プロンプティング手法 説明
Zero-Shot プロンプティング AI に事前の例を示さず、出力をさせる方法
Few-Shot プロンプティング 複数の例を示してから出力をさせる方法
この記事は Zero-Shot か Few-Shot を使い分けることができるようになることが目標です。

Zero-Shot の例
Zero-Shot は、例示なしで直接指示を出す方法です。モデルに事前の例を示さず、タスクを実行させます。

プロンプトの例
以下の文章の感情はポジティブですか、ネガティブですか?
「この映画は時間の無駄だった。二度と見たくない。」

手書きのメモなども読み取れるためデータ化したい時にはこの方法が便利です。

デザインの修正の提案

スライドなどのデザインで困った時にはAIに提案してもらうことができます。
どこまでAIの指示通りに修正するかは自由ですが、自分が持っていない新たな視点をAIが提案してくれることがあります!

プロンプト(画像も添付)

同じようなニュアンスであればOK!```
このスライドのデザインを修正する時のアドバイスをください

### 画像

![alt text](https://devio2024-2-media.developers.io/upload/1wqA04ZzfbvELzmUfnhuDQ/2025-06-25/Cc7ufApZNp7y.png)

### AIの出力

```markdown
このスライドのデザインを改善するための具体的なアドバイスをお伝えします:

## 🎨 **色とコントラストの改善**
- **背景色の統一**:オレンジ色の背景が不規則に配置されているため、全体を白背景に統一することをお勧めします
- **アクセントカラーの活用**:重要な要素(タイトルや矢印)にのみオレンジを使用し、メリハリをつけましょう

## 📐 **レイアウトの整理**
- **要素の配置を統一**:左側の箇条書きと右側の図解の位置関係を整理し、バランスを取りましょう
- **余白の確保**:各要素間に十分な余白を設けて、視覚的な圧迫感を軽減しましょう

## 🔄 **図解の改善**
- **矢印のデザイン統一**:現在2種類の矢印があるため、1つのスタイルに統一しましょう
- **ボックスサイズの調整**:「個人の改善」「組織の改善」のボックスが他より小さいため、サイズを統一しましょう

## 📝 **情報の整理**
- **階層構造の明確化**:左側の3つの項目と右側の図解の関係性をより明確に示しましょう
- **フォントサイズの調整**:重要度に応じてフォントサイズにメリハリをつけましょう

## 💡 **全体的な提案**
シンプルで清潔感のあるデザインにすることで、内容がより伝わりやすくなります。特に「価値創出」という重要なテーマなので、視覚的にもプロフェッショナルな印象を与えることが大切です。

画像の内容説明

画像の内容をテキストに表して説明してもらうことで画像の理解に役立てることができます!
なかなか画像の内容が理解できない時は一旦AIに説明してもらい壁打ちをすることもおすすめです!

プロンプト

これは何を表していますか?

画像

alt text

AIの出力

この図は、**AWS WAFログの分析システムのアーキテクチャ**を表しています。

具体的には以下のような流れを示しています:

## データフロー
1. **WAF Logs S3** - WAF(Web Application Firewall)のログがS3に保存される
2. **AWS Glue Catalog** - ログデータのメタデータを作成・管理
3. **Amazon Athena** - S3上のログデータに対してSQLクエリを実行
4. **結果用 S3** - 分析結果を保存

## 各コンポーネントの役割
- **AWS Glue Catalog**: データのスキーマ提供
- **分析者**: SQLクエリの実行
- **IAM ロール**: 適切な権限付与によるセキュリティ管理
- **Amazon Athena**: サーバーレスでのクエリ実行エンジン

このアーキテクチャは、WAFログを効率的に分析するための典型的なAWSサーバーレス分析パターンで、ログの保存から分析、結果の保存までを自動化・効率化するシステム構成を表現しています。

まとめ

このように画像を使うことで、テキストよりも多くのコンテキストをAIに渡すことができます。
テキストの方が正確性は高いですが、画像の柔軟さのおかげで作業などがより効率化されると嬉しいです。

前回のブログ

https://dev.classmethod.jp/articles/rag-retrieval-augmented-generation-guide/

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.