Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Text-to-SQLで自然言語から構造化データを取得する

Shota Totsuka
February 05, 2025
60

 Text-to-SQLで自然言語から構造化データを取得する

Shota Totsuka

February 05, 2025
Tweet

Transcript

  1. 自己紹介 ©Blueish 2024. All rights reserved. 戸塚 翔太|BLUEISH Shota Totsuka

    ・LLMアプリ開発者(Go/Python …etc) ・生成AI, 機械学習 ・趣味: スキー/スノボ, 最近はDifyにContribute ・静岡県(浜松)に住んでます  近くの方がいれば、一緒に勉強会しましょう! Xアカウント @totsukash
  2. - 自然言語からSQLを作成 - 例: 「idが1の人の名前は?」 →「SELECT name FROM table WHERE

    id = 1」 - DBのスキーマ等とプロンプトの指示を元にSQLを作成 - 概念としてはLLMの隆盛前からあったが、生成AIでより難易度が低下 Text-to-SQL Text-to-SQLについて
  3. ©Blueish 2024. All rights reserved. - ベクトル検索 - 類似度の高いものを探す -

    完全一致ではない - Text-to-SQL - 条件に合うものを探す - 曖昧度は低いが、SQLが正し く生成されなければ正しく情 報を取得できない ベクトル検索との違い Text-to-SQLについて
  4. ©Blueish 2024. All rights reserved. やってみた ©Blueish 2024. All rights

    reserved. - Bedrock ナレッジベース - ナレッジベースを通してSQLクエリを生成し、実行結果を取得 - Redshift Serverless - 構築したテーブルに対して、実際にSQLクエリを実行するためのクエリエンジン - S3 - csvファイルを格納 構成
  5. ©Blueish 2024. All rights reserved. やってみた ©Blueish 2024. All rights

    reserved. - AWS が提供するクラウドベースのデータウェアハウスサービス - クエリエンジンの提供 - サーバーレス運用 → 運用コストの削減 Redshift Serverless
  6. ©Blueish 2024. All rights reserved. やってみた ©Blueish 2024. All rights

    reserved. - id - name - email - …etc RedshiftでDBを準備 データ構成は以下記事のものを使用させていただきました。 https://blog.denet.co.jp/adcale2024_bedrock-knowledge-bases-structured-data-retrieval/
  7. ©Blueish 2024. All rights reserved. やってみた ©Blueish 2024. All rights

    reserved. - 2024年12月4日 AWS re:Invent 2024 で構造化データ取得のサポートがプレ ビューとして発表 - 現在はRedshiftのみサポート? Bedrock ナレッジベース(with 構造化データ)
  8. ©Blueish 2024. All rights reserved. ハマったこと ©Blueish 2024. All rights

    reserved. - 日本語で書いて欲しいクエリが英語に置換される 【解決策】 - 「”サッカー”は英語に訳さず日本語でクエリに使用して」など ①日本語が微妙
  9. ©Blueish 2024. All rights reserved. ハマったこと ©Blueish 2024. All rights

    reserved. - Generation/Orchestration それぞれ変更可能 - 出力形式やテーブルのスキーマを上書きするこ とはできなさそう - temperatureなどのパラメータは変更可能 プロンプトテンプレートの変更も可能