Pinecone が提供している RAG 機能 Pinecone Assistant を試してみる

Pinecone が提供している RAG 機能 Pinecone Assistant を試してみる

サーバレスかつ良いモデルを使いたいの2軸でかなり尖ってる印象です。
Clock Icon2024.09.30

こんにちは!AWS 事業本部コンサルティング部のたかくに(@takakuni_)です。

今回はタイトルの通り、 Pinecone Assistant を試してみます。

Pinecone Assistant 機能とは

Pinecone Assistant は Pinecone が提供する RAG のサービスです。RAG に登録したいドキュメントをコンソール or Pinecone SDKs 経由アップロードすることで、エンべディング、ベクトルデータベースへの保管をマネージドに行ってくれます。

RAG に対する質問/回答生成も、コンソール or Pinecone SDKs 経由で操作可能で Pinecone で RAG を完結できる機能です。

AWS でいうところの Amazon Q for Business に近しい存在でしょうか。

How it works
When you upload a document, your assistant processes the contents by chunking and embedding the text. Then, the assistant stores the embeddings in a vector database. When you chat with your assistant, it queries a large language model (LLM) with your prompt and any relevant information from your data sources. With this context, the LLM can provide responses grounded in your documents.

Assistant manages embedding generation and storage and prompting the LLM: you do not directly access these parts of the system. You upload the files and chat with the model, and Assistant manages all other components.

https://docs.pinecone.io/guides/assistant/understanding-assistant

ドキュメント形式

続いてアップロード可能なドキュメント形式です。

マネージドな RAG の立ち位置あるため、ドキュメントの形式は .txt, .pdf のみ対応しています。非対応の形式の場合は事前に形式変換処理が必要ですね。

その他の制限事項については以下をご覧ください。

https://docs.pinecone.io/guides/assistant/understanding-assistant#limitations

https://docs.pinecone.io/guides/assistant/upload-file#limitations

モデルがすごい

ここが真骨頂です。Amazon Q for Business と違い、回答生成のモデルを選べます。

なんと、回答生成には OpenAI 社の GPT-4o と Anthropic 社の Claude 3.5 Sonnet が使えます。逆にこの 2 つのみサポートしています。尖り具合、凄くないですか。

https://docs.pinecone.io/guides/assistant/chat-with-assistant#choose-a-model-for-your-assistant

どのクラウドにも左右されない、3rd Party ならではの強みだと思います。

やってみる

それでは Pinecone Assistant を利用して、RAG を体験してみます。

今回は桃太郎を使って RAG を構築してみます。

Pinecone SDKs もありますが、今回は温もりのあるコンソールでぽちぽちと。

Pinecone のプランは Standard Plan を利用します。サブスクリプションの紐付け等はスキップします。

https://aws.amazon.com/jp/blogs/news/leveraging-pinecone-on-aws-marketplace-as-a-knowledge-base-for-amazon-bedrock/

アシスタントの作成

まずはアシスタントの作成を行います。 Assistants から Create an assistant をクリックします。

2024-09-30 at 21.35.22-Pinecone Console@2x.png

名前は momotarou とします。

2024-09-30 at 21.36.45-Pinecone Console@2x.png

データのアップロード

アシスタントを作成すると、早速ファイルアップロード画面に移ります。

今回は以下のドキュメントをアップロードします。

https://github.com/takakuni-classmethod/genai-blog/tree/main/サンプルドキュメント/momotarou

ファイルをアップロードすると、このようなインポート画面になります。複数ファイルをアップロードできるのはとっても便利ですね。

2024-09-30 at 21.41.20-momotarou  Pinecone Console@2x.png

アップロードしてみると、なんと失敗してしまいました。

2024-09-30 at 21.56.52-momotarou  Pinecone Console@2x.png

調べてみて気がついたのですが、ファイル名は英語で記載する必要がありました。以下は中身は日本語ですが、ファイル名変更によって成功している例です。

2024-09-30 at 22.01.46-momotarou  Pinecone Console@2x.png

プロンプトを投げる

最後に質問してみましょう。

エンべディングモデルやベクトルデータベースの話はないままここまで来ました。マネージド感が凄まじいですね。

質問をしてみましたが、適した回答が返ってきています。(引用付きで)

また、評価ボタンもついています。(おそらく、チャンク化が望ましいものだったかを、フィードバックするのではないかと予想されます。)

2024-09-30 at 22.06.30-momotarou  Pinecone Console@2x.png

なお、モデルの切り替えは設定アイコンから可能です。

2024-09-30 at 22.08.09-momotarou  Pinecone Console@2x.png

料金

パブリックプレビュー段階ですが、Standard プランだと次の料金形態です。

日別あたりの料金(月額換算で 6 USD)はあるものの、その他の観点では非常にサーバレスな作りとなっています。

  • ストレージ:1GB あたり月 3USD
  • 入力トークン:100 万トークンあたり 8 USD
  • 出力トークン:100 万トークンあたり 15 USD
  • 1 日あたり 0.2 USD

https://www.pinecone.io/pricing/

まとめ

以上、「Pinecone Assistant を試してみる」でした。

非常にシンプルな作りの一方、サーバレス、利用可能なモデルの尖り具合がすごくて、刺さる人には刺さるのではないでしょうか。

GA が非常に期待できますね。このブログがどなたかの参考になれば幸いです。

AWS 事業本部コンサルティング部のたかくに(@takakuni_)でした!

この記事をシェアする

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.