Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
JAWS-UG Bedrock Claude Night
Search
Hiroki YAMAMOTO
April 22, 2024
Technology
1.5k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
JAWS-UG Bedrock Claude Night
Hiroki YAMAMOTO
April 22, 2024
More Decks by Hiroki YAMAMOTO
See All by Hiroki YAMAMOTO
Classmethod Odyssey 登壇資料
yamahiro
0
1.6k
実例で紹介するRAG導入時の知見と精度向上の勘所
yamahiro
8
11k
DEIM2024 チュートリアル ~AWSで生成AIのRAGを使ったチャットボットを作ってみよう~
yamahiro
3
2.1k
RAGに関する知見
yamahiro
10
85k
Jagu'e'r Tech Writers Meetup #1
yamahiro
0
940
LangChain Japan Meetup
yamahiro
0
1.3k
【Developers IO Dey One】 Passregi CVの現在と取り組んできた改良
yamahiro
0
1.3k
re:Growth 2021 Amazon Store Amazing Points
yamahiro
0
1.1k
Other Decks in Technology
See All in Technology
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
230
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
240
Djangoユーザが知っ得なPostgreSQL機能 - 設計の選択肢を増やす / Djang-use-PostgreSQL
soudai
PRO
0
180
Mastering Ruby Box
tagomoris
3
150
Databricks における 生成AIガバナンスの実践
taka_aki
1
310
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
210
ChatworkとBPaaS 異なる特性で学んだAI機能開発の ベストプラクティス
kubell_hr
2
2.7k
noUncheckedIndexedAccess、3時間、1万円。 / noUncheckedIndexedAccess, 3 Hours, 10,000 JPY.
kaonavi
1
300
先取りMaven4 ~16年ぶりのメジャーアップデート、その進化とは?~
ogiwarat
0
140
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
250
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
360
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
1.5k
Featured
See All Featured
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
250
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Done Done
chrislema
186
16k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
130
Amusing Abliteration
ianozsvald
1
200
Between Models and Reality
mayunak
4
330
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2.1k
Code Reviewing Like a Champion
maltzj
528
40k
The Cost Of JavaScript in 2023
addyosmani
55
10k
Embracing the Ebb and Flow
colly
88
5.1k
Transcript
Claude 3を使って RAGの一番の悩みポイントを解決してみた Bedrock Claude Night (JAWS-UG AI/ML支部 × 東京支部コラボ)
クラスメソッド株式会社 新規事業部 生成AIチーム 山本紘暉
自己紹介:山本紘暉 クラスメソッド株式会社 研究開発エンジニア 2020年 5月~ ・コンピュータビジョン 骨格検出や人物追跡 2023年 3月~ ・生成AIやLLM
最近はRAGに注力 「クラスメソッド 山本 ブログ」で検索 https://dev.classmethod.jp/author/yamamoto-hiroki/ 研究開発 ・最新研究と実適用の間の橋渡し ・妥当な期間・コスト・品質 ・着実に進めるために ・有り物だけでなく自作も
背景・前提知識
RAGとは LLM単体では知らないことを答えさせる (RAG:Retrieval Augmented Generation) 検索 で LLM を 拡張
LLMの問題点・RAGの目的 ユーザ 質問 誤った回答 LLM プログラム 質問 誤った回答 ユーザ 質問
正しい回答 LLM プログラム 質問 + 関連テキスト 正しい回答 参考 ドキュメント 検索 関連テキスト 通常 RAG
RAGを使った質問・回答の様子 質問 ・社内手続きに関する質問 「名刺を発注したいのですが、 どうすればいいですか?」 回答 ・参考ドキュメントに基づいて、 発注方法を回答してくれる (使用したドキュメントへのリンクも表示)
山本の今までの取り組み 社内 ・QAボットを作成してみた ・改善ポイントを分析した 案件(お客様向け) ・システムを構築した ・使用状況データを分析した
ブログにまとめてます https://dev.classmethod.jp/articles/improve-work- efficiency-with-generateive-ai-chatbot-using-rag/ https://dev.classmethod.jp/articles/rag- knowledge-on-real-projects/
実際にやってみての課題 (の内の1つ)
課題:人間の読み方とシステムの読み方が異なる 人間 読むとわかる 違う読まれ方をする システム ドキュメント 人間が読んでわかりやすい ≠ システムが読み込んだあとの形式がわかりやすい 人間
課題:PowerPointファイルの読まれ方 https://www.jinji.go.jp/saiyo/siken/senkou/setsumeikai_17.pptx 順番が変わる (オブジェクトのレイヤー順で読まれてる ※推測) 親子関係がわかりにくいテキストになる ① ② ③ ①
③ ②
課題:画像は読まれない https://www.jinji.go.jp/saiyo/siken/senkou/setsumeikai_17.pptx そもそも画像があったかどうかも わからない ※ Kendraのリファレンスにも デフォルトでは画像が読み込まれないことは明記されています 補足:既存のドキュメントローダーでは、 画像は読み込まれるものの、 変換はあまりいい感じではないことが多い
課題:PDFファイルの読まれ方(ヘッダ・フッタ部分) 本文間にフッターやページ数が 入り込んでしまう
課題:PDFファイルの読まれ方(表部分) 表部分がテキストの羅列になってしまう チャンクが表の途中で途切れてしまう (→ カラム名が分からなくなる)
解決方法・結果
方法:マルチモーダルなモデルを使う 人間 読むとわかる 人間と同じような読み方 ドキュメント マルチモーダルなモデル
結果:パワポ資料を人間が読む順序で文字起こしできた 詳細はこちらのブログをご覧ください https://dev.classmethod.jp/articles/read-powerpoint-document-with-claude-3/ # 経済産業省のMission ## 日本経済・国民の暮らしを豊 かにする ### 産業政策
- 人工知能、IoT、ヘルスケア - データ活用、中小企業 - 産業構造・・・ ### 通商・貿易 - EPA、TPP、インフラ輸出 - 新興国戦略、ルール形成 - 戦略・・・ ### 資源・エネルギー - 電力自由化、新エネ・省エネ - 原発、資源外交・・・ ### 手段 - 経済成長 - 産業競争力の強化 - イノベーション - 世界の富の取り込み - エネルギー安定供給 ### 目的 - 社会課題の解決 Ex.少子高齢化、貧困問題、 世界の不安定化 - 豊かな社会の実現
結果:画像を説明させることができた 詳細はこちらのブログをご覧ください https://dev.classmethod.jp/articles/read-powerpoint-document-with-claude-3/ # 活気ある職場・働きやすい環境 1 ## 職場風景 [オフィスの様子が写っている。複数の人が机を囲んで作業を している。]
[3人の男女がパンフレットを見ながら話し合っている。壁に は絵画が掛かっている。] ## 働きやすい職場環境 - テレワーク ※29FYは延べ7,000人以上が実施。中央省庁では 最多。 - ペーパーレス ※4年で37%削減 - フレックス - 風通しのよい職場 (職員意識調査:職場満足度77割以上) - 様々な研修制度 (年間100回以上の勉強会の開催など) [2台のノートPCが写っている。] 個人PC:軽量で持ち運びが容易 ※ プロンプトの指示は簡易なものを使用したので、 改良の余地があります
結果:PDF資料を人間が理解する形で文字起こしできた # セキュリティ体制 ## ISMS・ITSMS上の役割 役割 | 氏名 --- |
--- 最高情報責任者(CIO) | Aさん 情報セキュリティ管理責任者(CISO) | Aさん サービス管理責任者 | Aさん ISMS事務局、ITSMS推進事務局 | Aさん ITSMS推進(AWS事業本部オペレーション部) | Aさん ...(※ 略)... AWS事業本部(モダンアプリケーションコンサルティング 部) | Aさん | Aさん AWS事業本部(サービス企画室) | Aさん | Aさん CX事業本部(Business 部) | Aさん | Aさん CX事業本部(Delivery 部) | Aさん | Aさん データアナリティクス事業本部(インテグレーション部) | Aさん | Aさん ...(※ 略)... 不要な情報(フッター・ページ数)を削除 ページの切れ目があってもつなげて出力 表部分をMarkdown形式で出力 (Claude3は1リクエストに複数画像を含めることができる) (※ 略) は正しい結果が出力されていました
参考: ※ 厳密な比較ではありません GeminiやGPT4(2024年2月時点)では、 文字起こしにちょっとミスがあった Claude3 Opusでは、同様のプロンプトで、 ミスなく文字起こしできた → Claude3
Opusの方が良さそう、という印象 GPT4での文字起こし結果 富 → 高 (複数枚の画像を同時に渡せるのも使いやすい)
補足:認識できる文字サイズ・OCRで補助 https://dev.classmethod.jp/articles/simple- examination-on-recognizable-char-size-with-claude-3/ https://dev.classmethod.jp/articles/fix-claude3-text- recognition-mistake-with-azure-document- intelligence/
まとめ・言いたかったこと RAGの悩みポイント ・ドキュメントの読み込まれ方が人間の意図と異なる(ことがある) 解決方法 ・マルチモーダルなモデルを使って、Markdown形式で文字起こし → 試した感じできそう ・OCR AIとの組み合わせも使えそう Claude3すごい良さそう