Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[IBM TechXchange Dojo]Watson Discoveryとwatsonx....

siyuanzh
January 14, 2025

[IBM TechXchange Dojo]Watson Discoveryとwatsonx.aiでRAGを実現!事例のご紹介+座学②

[IBM TechXchange Dojo]Watson Discoveryとwatsonx.aiでRAGを実現!
- 株式会社システムリサーチ様による事例のご紹介
- 座学②

siyuanzh

January 14, 2025
Tweet

More Decks by siyuanzh

Other Decks in Technology

Transcript

  1. 自己紹介 3 ✓毛利 茂弘(Shigehiro Mouri) ✓ 数々のプロジェクトに関わり、様々なアプリケーションシステム、インフラ基盤を中心としたシステム等Project Managerを務める ✓ IBM

    Technology(Watson Discovery/Watson STT/watsonx.ai/Maximo Visual Inspection)AIを利用したソ リューション提案、デリバリー ✓ IBM Consultingのコアパートナーとしてデリバリー ✓ Deep Learning、Cloud、Mobile、ERP、CRMなど新たなビジネス領域にチャレンジ ✓ 受賞歴 ✓ IBM Japan Excellence Award 2020 ✓ IBM Champion 2021 ✓ IBM Champion 2022 ✓ IBM Japan Excellence Award 2022 ✓ IBM Champion 2023 ✓ IBM Japan Excellence Award 2023 ✓ IBM Champion 2024 20
  2. 会社紹介 名称 株式会社システムリサーチ 本社所在地 名古屋市中村区岩塚本通二丁目12番 支店 東京支店・大阪支店 設立 1981年3月26日 資本金

    5億5,015万円 従業員数 1,572名(単体2024年4月1日現在) 売上高(単体) 232億8,002万円(2024年3月期実績) 証券コード 3771(東証プライム市場) 代表 代表取締役会長 山田 敏行 代表取締役社長 平山 宏 関連会社 株式会社ソエル(特例子会社):ソフトウェア開発/ウェブサイト制作・構築(障がい者 雇用) 認定等 ISO9001認証取得企業(JQA-QM7891) ISMS認証取得企業(IS 81748/ISO(JIS Q)27001) プライバシーマーク付与事業者(19001186) 労働者派遣事業(許可番号:派23-300001) 東京リューション部 営業所
  3. ランニングコストが高くなったため、 Web Applicationを新たに構築し soul machines & Watson Assistant 以外を活かしたRAGにチャレンジしました 新たなシステム構成

    6 Watson Discovery 質問内容を検索 ユーザー 生成AIの管理操作 検索対象 データ 大規模言語 モデル Web Application
  4. チャット検索画面 7 • チャット形式でAIに質問をす ることができます。 • 選択されたプロジェクト、コ レクションに含まれるドキュ メントを基にAIが回答を生成 しています。

    • 回答生成に利用する言語モデ ルの選択や、出力する文字数 (トークン数)の調整、質問内 容のリフレッシュも可能です。 コレクションを選択するとそのコ レクション内、選択していないと プロジェクト内が文書の検索対象 になります 【AIの回答部分】 デジクエリに事前にアップロードしたス マートフォンの説明書から必要な情報を 検索し、その情報を基に回答を生成して います コレクション等を変更して別の質問がしたい場合に 質問内容のリフレッシュを行います 回答生成時に参考にし たドキュメントの一覧 を表示します。 「PDFを開く」を押すと、PDFの実際のページ を表示することができます。 「この情報は役に立ちました か?」という項目を選択し、 フィードバックを送信すると、 その後の似た質問で、AIが参考 にするドキュメントの優先順位 が変わります。
  5. ドキュメント分割が楽 14 電源を入れる 1.サイドキーを2秒以上押す ・起動画面が表示され、続い・・・ ・初めて電源を入れたときは・・・ 2.画面をスワイプ 電源を切る 1.サイドキーを1秒以上押す 2.「電源OFF」→「電源OFF」

    ・本端末が振動し 電源を入れる 1.サイドキーを2秒以上押す ・起動画面が表示され、続い・・・ ・初めて電源を入れたときは・・・ 2.画面をスワイプ 電源を切る 1.サイドキーを1秒以上押す 2.「電源OFF」→「電源OFF」 ・本端末が振動し 見出しごとに分割 検索処理の効率化や精度向上が期待できる
  6. APIを呼ぶだけなので実装が楽 16 query_results = discovery.query( project_id=project_id, collection_ids=[collection_id], natural_language_query=message, passages={ "enabled":

    True, "find_answers": True, "per_document": True, }, count=5, ).get_result() 上位5件を取得 ユーザーからの質問 ユーザーからの質問内容をそのまま検索クエリとすることで、関連するドキュメントを簡単に取得することができます。
  7. アップロードできるドキュメント数の制限 19 プラス エンタープライズ プレミアム 課金単位 文書数 *、検索数 文書数 *、検索数

    文書数 * 基本料金 インスタンス部分 - 月額 500 ドル 10,000件の文書を含む 10,000 クエリを含む インスタンス部分 - 月額 5000 ドル 10万件の文書を含む 100,000 クエリを含む インスタンス部分 - 月額 8,500 ドル 追加の文書(Document) - 追加文書1,000件につき50ドル 0~100万件の場合、追加文書1,000件ごとに月額5ド ル 100万件以上の文書については特別割引が適用されま す サイズに基づくインスタンスパーツ S – 100 万ドキュメント - 月額 1,500 ドル MS - 200 万ドキュメント - 月額 3,000 ドル M – 4M ドキュメント - 月額 5,000 ドル … 追加のクエリ(Query) - 追加クエリ1,000件につき20ドル 0~100万件の場合、追加1,000クエリごとに月額5ド ル 100万件以上のクエリについては、特別割引をご利用 いただけます 該当なし クエリ量はサイズに関連するリソース (CPU/メモリ)によって制限されます 文書数上限 * 50万 無制限(10万超は追加料金) 無制限 コレクション上限数 40 300 300 クエリー数制限 50万クエリー/月 5クエリー/秒 10万~無制限 5クエリー/秒 無制限 50クエリー/秒 プロジェクト上限数 20 100 100 当文書作成時点の情報に基づきます。最新の正確な情報は下記をご参照ください。 https://cloud.ibm.com/docs/discovery-data * 文書数はソースのファイルではなく、Discoveryで分割やエンリッチメント加工した後の文書を指します(CSV, データベースは1行1文書とカウントされます。また取り込んだファイルをSDU機能 で分割した場合は分割した1セグメントが1文書としてカウントされます。)