Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Knowledge Bases for Amazon Bedrockの推しポイント

Knowledge Bases for Amazon Bedrockの推しポイント

JAWS-UG 名古屋 生成AI夏祭り
https://jawsug-nagoya.connpass.com/event/324585/

で発表した資料です。

moritalous

July 29, 2024
Tweet

More Decks by moritalous

Other Decks in Technology

Transcript

  1. 自己紹介 森田 和明 富士ソフト株式会社 主任 / フェロー(アーキテクト・エバンジェリスト) AWS Ambassador(2023~) AWS Top Engineer(2020~)

    AWS All Certifications Engineer(2024) AWS Community Builder 生成AIに限らず、AWS関係のアーキテクトとエバンジェリストをやってます Java Webアプリ開発出身 新しいもの好き X / Qiita / GitHub : @moritalous 「Jumping deer with japanese temple」 Amazon Titan Image Generatorにて生成
  2. チャンク分割の方法が充実 チャンク分割方法 内容 デフォルト 300トークンごとに分割 固定サイズ 分割するトークンのサイズとオーバーラップ(重複)の割合 を指定 階層型チャンキング 親チャンクのトークンサイズと子チャンクのトークンサイ

    ズ、子チャンクのオーバーラップを指定。ベクトル化される のは子チャンク セマンティックチャンキング テキストの意味を理解して分割 チャンキングなし チャンキングしないので 1ファイルの文章が埋め込みモデ ルの上限を超えないか気にする必要がある
  3. Amazon Bedrock は、大手 AI スタートアップ企業や Amazon の高性能な基盤モデル (FM) を統合 API

    を通じて利用できるよ うにした、フルマネージド型のサービスです。 幅広い基盤モデルから選択して、ユースケースに最適なモデル を見つけることができます。 Amazon Bedrock は、セキュリティ、 プライバシー、責任ある AI を備えた生成 AI アプリケーションを 構築するための幅広い機能も提供します。 Amazon Bedrock を使用すると、ユースケースに最適な基盤モ デルを簡単に試して評価し、微調整や Retrieval Augmented Generation (RAG) などの手法を使用してデータで非公開にカス タマイズし、エンタープライズシステムとデータソースを使用して タスクを実行するエージェントを構築できます。 チャンク分割の方法が充実 階層型チャンキングのイメージ 質問 Bedrockとは? ドキュメント 子チャンク 親チャンク 回答生成プロンプト 以下のドキュメントから、ユーザーの質問に回答してください。 <document> {検索結果} </document> ユーザーの質問: Bedrockとは? Amazon Bedrock は、Amazon が提供するフルマネージド型のサービスです。 Amazon Bedrock は、以下のような特徴を持つサービスです : 1. 大手 AI スタートアップ企業や Amazon の高性能な基盤モデル (FM) を統合 API を通 じて利用できるようにしたフルマネージド型のサービスです。 2. 幅広い基盤モデルから選択して、ユースケースに最適なモデルを見つけることができ ます。 3. セキュリティ、プライバシー、責任ある AI を備えた生成 AI アプリケーションを構築する ための幅広い機能を提供します。 4. ユースケースに最適な基盤モデルを簡単に試して評価し、微調整や Retrieval Augmented Generation (RAG) などの手法を使用してデータで非公開にカスタマイズし、 エンタープライズシステムとデータソースを使用してタスクを実行するエージェントを構築 できます。 つまり、Amazon Bedrock は、さまざまな高性能な基盤モデルを統合的に利用できるフ ルマネージドのサービスで、生成 AI アプリケーションの構築を支援するものです。 階層型でないばあい(検索時のチャンクと回答生成時のチャンクが同一) 階層型のばあい(回答生成時に親チャンクを使用する) 近いチャンクを探す 検索は子チャンクで行う
  4. 2. ナレベベの推しポイント 1. RAGに必要な機能がそろってる 2. チャンク分割に「階層型チャンキング」が選択可能 3. テキスト抽出にClaudeが利用可能 4. 検索キーワードのサブクエリー化可能

    5. ナレッジベースを複数作っても安心 6. セッション保持機能あり 7. エージェントと連携可能 8. ナレッジベースなしでも利用可能
  5. 2. ナレベベの推しポイント 1. RAGに必要な機能がそろってる 2. チャンク分割に「階層型チャンキング」が選択可能 3. テキスト抽出にClaudeが利用可能 4. 検索キーワードのサブクエリー化可能

    5. ナレッジベースを複数作っても安心 6. セッション保持機能あり 7. エージェントと連携可能 8. ナレッジベースなしでも利用可能