Upgrade to Pro — share decks privately, control downloads, hide ads and more …

実践マルチモーダル検索!

 実践マルチモーダル検索!

Avatar for shibuiwilliam

shibuiwilliam

October 30, 2025
Tweet

More Decks by shibuiwilliam

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 shibui yusuke • いろいろ → Stability AI → LayerX(いまここ)

    • データ検索とR&Dのマネージャー • MLOps & データ検索 & バックエンド & インフラ & その他諸々エンジニア • MLOpsコミュニティ運営 • 最近やりたいこと ⽣成AIの⽣成AI以外のエンジニアリング • Github: @shibuiwilliam • FB: yusuke.shibui 猫のようで サイズは犬 猫耳メガネ LLMに聞いてみた
  2. © LayerX Inc. 8 ⽣成AIで拡張する情報抽出 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター

    トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10年 間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }, { "label": "TOPIX", "color": "黒", "trend": "ほぼ横ばいで推移。成⻑率は+100〜200%程度。" } ] }, "graph_meaning": { "main_message": "GAFAMのような新興企業が⽶国経済成⻑を 牽引しており、それらを除くと⽇⽶の株式市場の成⻑差は⼩さい ことを⽰している。", "insight": "スタートアップや新興企業の存在が経済全体の成⻑ に⼤きな影響を与えており、⽇本でも同様にイノベーションを⽣ み出すスタートアップの育成が重要であることを⽰唆している。" } }
  3. © LayerX Inc. 10 検索に登録するデータ 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 XXレポート.pptx

    個々のコンテンツ OCR/VLM Object detection 全⽂検索 ベクトル検索 ベクトル検索 ベクトル検索 カテゴリ検索 全⽂検索 全⽂検索 ベクトル検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM
  4. © LayerX Inc. 11 検索する⽅法                画像による検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ

    画像⾔語 ベクトル 画像⾔語 ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM VLM VLM VLM クエリ画像からテキストを 抽出してカテゴリ、全⽂検索 クエリ画像からベクトルを 作成して類似ベクトル検索
  5. © LayerX Inc. 12 検索する⽅法                画像による検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ

    画像⾔語 ベクトル 画像⾔語 ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 全般的に作成、調整、テストが⼿間
  6. © LayerX Inc. 14 検索する⽅法              テキストによる検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ

    画像⾔語 ベクトル テキスト ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 作成、調整しやすい 作成、調整が⼿間 画像コンテンツを テキスト検索する 丁度よい⼿法
  7. © LayerX Inc. 16 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding

    & rewrite LLMのテキスト‧画像認識を 活⽤して、スライドの コンテンツ情報を構造的に 抽出し、検索データとする Title Description Keywords Object
  8. © LayerX Inc. 17 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding

    & rewrite クエリの検索⽬的や⽤途に 応じてスキーマの重みを 調整し、検索性能を向上 Title: 0.1 Description: 0.3 Keywords: 0.1 Object: 0.5 Query 右肩上がりのグラフ
  9. © LayerX Inc. 18 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding

    & rewrite クエリやコンテキストから LLMで意図を理解し、 クエリをリライト Query AI Agentを作りたいけど 作り⽅とかわからないし 最近はOpenAIとか有名だ けどPythonとか‧‧‧ Rewrite AI Agentの作り⽅, OpenAIのAI Agent, PythonのAI Agent開発 初⼼者向け
  10. © LayerX Inc. 20 実践マルチモーダル検索!まとめ 検索インデックス クエリ 検索手法 コメント メタデータ

    → タグやカテゴリ タグやカテゴリ カテゴリ検索 これが一番楽。おすすめ テキスト → テキスト テキスト 全文検索 ベクトル検索 データ抽出も調整、テストも やりやすい 画像 → テキスト テキスト 全文検索 ベクトル検索 LLM/VLMを信じて費用対効果が 出せるならOK 画像 → 画像 画像 ベクトル検索 画像が好きなら試すのも有り
  11. © LayerX Inc. 21 We are hiring! AI検索エンジニア https://open.talentio.com/r/1/c/layerx/pages/107758 Applied

    R&Dリサーチエンジニア https://open.talentio.com/r/1/c/layerx/pages/110834 MLOps / 機械学習基盤エンジニア https://open.talentio.com/r/1/c/layerx/pages/112898