Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT資料 - MNTSQの契約書解析を LLMに置き換える話
Search
mntsq
July 11, 2024
Technology
1.9k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LT資料 - MNTSQの契約書解析を LLMに置き換える話
mntsq
July 11, 2024
More Decks by mntsq
See All by mntsq
MNTSQ Legal Expert Deck
mntsq
0
690
_SSoT_MNTSQ-CompanyDeck_公開用_.pdf
mntsq
0
80
CRE Camp #1 エンジニアリングを民主化するCREチームでありたい話
mntsq
2
460
Life at MNTSQ
mntsq
1
44k
MNTSQと生成AI
mntsq
0
1.7k
MNTSQ Engineering Team Deck
mntsq
0
21k
MNTSQ Company Deck
mntsq
6
110k
「すべての合意をフェアにする」ってなんだ
mntsq
0
880
MNTSQ社内勉強会 #1 スタートアップの開発サイクルを調べてみた
mntsq
0
780
Other Decks in Technology
See All in Technology
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
210
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
Claude Code×Terraform IaC テンプレート駆動開発
itouhi
1
490
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
360
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.9k
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
2.1k
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
260
新規事業を牽引する技術選定 〜フルスタックTypeScript開発の実践事例〜
nullnull
3
380
自律型AIエージェントは何を破壊するのか
kojira
0
150
Agentic Web
dynamis
1
200
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
720
「速く作る」から「正しく作る」へ ─ 生成AI時代の開発フロー改革の ロードマップと実行 ─
starfish719
0
9.7k
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Skip the Path - Find Your Career Trail
mkilby
1
140
A Modern Web Designer's Workflow
chriscoyier
698
190k
New Earth Scene 8
popppiees
3
2.3k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
The Spectacular Lies of Maps
axbom
PRO
1
800
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
280
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Transcript
©MNTSQ, Ltd. MNTSQの契約書解析を LLMに置き換える話 LT資料
©MNTSQ, Ltd. 2 発表の流れ 自己紹介 & 会社紹介 自己紹介/MNTSQのプロダクト/MNTSQのVision MNTSQの契約書解析をGPT-4oで解く やってみた
いくつかのプロンプトテクニック 小ネタ集 プロダクションにおける課題 いろいろ
©MNTSQ, Ltd. 3 Takumi Hirata • アルゴリズムエンジニア @ MNTSQ株式会社 •
機械学習やその周辺のソフトウェア開発を行っています • 最近はプロダクションにおけるLLM活用を推進しています 自己紹介
©MNTSQ, Ltd. 4 ドラフト 審査交渉 締結 集約 管 理 分
析 MNTSQ CLM MNTSQ 自動ドラフティング MNTSQ 案件管理 MNTSQ Connect MNTSQ 契約管理 MNTSQ データベース • 案件受付・アサイン • 審査状況の「見える化」 • ノウハウの自動提案 • リスクの自動検知 • 審査履歴の自動登録 • 電子契約連携 • 紙データのAI-OCR • 電子契約連携 • リスクマネジメント • 契約台帳の自動作成 • 契約期限など自動アラート • ナレッジマネジメント • NO&Tナレッジの活用 • 法務情報の自動分析 • オペレーションコンサル • 既存データの移行サポート • メール連携 • SharePoint・Box連携 • 自社雛型+NO&T雛型での自動ドラフト • 交渉ポリシー・解説文登録 • 案件に応じた叩き台を自動提案 契約業務を軸にしたtoB SaaS
©MNTSQ, Ltd. 5 契約は取引のプログラム もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Tech Blog より
©MNTSQ, Ltd. 6 すべての合意をフェアにする 誰もが一瞬でフェアな契約を結ぶことができればビジネスはもっと加速する リスクの制御 ビジネスの加速
©MNTSQ, Ltd. 7 ©MNTSQ, Ltd. 7 MNTSQの契約書解析をGPT-4oで解く 十分に発達した科学技術は、魔法と見分けがつかない。 “ クラークの三法則
より
©MNTSQ, Ltd. 8 契約書解析 : 分類・抽出等で契約書を構造化するタスク 秘密保持契約書 MNTSQ株式会社(以下、甲とする)とモンテス太郎(以下、乙とする)はXXX業務(以下、 本件業務とする)を遂行するにあたって、双方が開示する秘密情報の扱いについて次の とおり合意する。
(定義) 第1条 本契約において使用される語句の定義は次の通りとする。 (1)「開示者」とは、本契約の当事者のうち、他方の当事者に本秘密情報を開示する者 をいう。 (2) 「受領者」とは、開示者から本秘密情報を受領する者をいう。 (3) 「本秘密情報」とは、… 2. 前項にかかわらず、次の各号の一に該当する情報は秘密情報に該当しない。 (1) 取得した時に既に公知、公用となっていたもの (2) … (… 第2条 … 本契約の締結を証するため本書2通を作成し、甲乙記名押印の上、各1通を保有する。 2020年1月1日 .. NER(Named Entity Recognition) 文書分類 パッセージ分類 構造解析 照応解析 例えばどのような種類の契約書なの かを分類するなど、契約書全体の性 質をさまざまな角度から検討します タイトルの場所や、署名欄の検出と いった契約書全体の情報から、「こ の箇条書きはどの文の下位に属する のか」といった情報まで様々な分析 を行います。例えば、以下のような 条項の木構造を抽出したりします 契約書では定義された単語を参照し たり、他の条項を参照することが頻 繁に起きます。こういった参照を解 決するようなタスクもあります 人間は各条項をコンセプトとして捉 えています。例えば「反社会的勢力 に関する条項」を探したい、といっ た要望に答えられるように条や項に さまざまなタグを付与したりします 誰がいつ契約を結んだか、どれくら いの期間有効な契約なのかなど、契 約に関する基本的な情報を検出する のに、NERタスクを解くことは欠か せません
©MNTSQ, Ltd. 9 契約書を構造化してJSONに変換 MNTSQの契約書解析をGPT-4oで解く
©MNTSQ, Ltd. 10 プロンプト MNTSQの契約書解析をGPT-4oで解く OCRで抽出した契約書本文 出力のJSONスキーマ (ここが契約書解析の要!) 指示
©MNTSQ, Ltd. 11 ©MNTSQ, Ltd. 11 いくつかのプロンプトテクニック 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 2⃣
自己参照データモデルによる階層ツリー構造の抽出 3⃣ JSONをunpretty-printしてトークン節約
©MNTSQ, Ltd. 12 Pydanticによるデータモデルの定義 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック 契約データ 条項データ
©MNTSQ, Ltd. 13 model_json_schema でJSONスキーマを生成 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック
©MNTSQ, Ltd. 14 model_validate_json でGPT-4oの出力JSONを検査 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック
©MNTSQ, Ltd. 15 2⃣ 自己参照データモデルによる階層ツリー構造の抽出 いくつかのプロンプトテクニック 深さのわからない階層に対して再帰的に抽出 自己参照
©MNTSQ, Ltd. 16 2⃣ 自己参照データモデルによる階層ツリー構造の抽出 いくつかのプロンプトテクニック 深さのわからない階層に対して再帰的に抽出 前版にはなかった 子要素たち
©MNTSQ, Ltd. 17 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック unpretty-printとは、読みやすさのための改行や空白を除去すること
©MNTSQ, Ltd. 18 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック JSONのunpretty-printにより約43%のコスト削減 トークン数: 金額: 783
$0.003915 443 $0.002215
©MNTSQ, Ltd. 19 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック プロンプトの変更
©MNTSQ, Ltd. 20 ©MNTSQ, Ltd. 20 プロダクションにおける課題 Unfortunately, as anyone
who has worked on shipping real-world software knows, there’s a world of difference between a demo that works in a controlled setting and a product that operates reliably at scale. “ What We’ve Learned From A Year of Building with LLMs より
©MNTSQ, Ltd. 21 コンテキストウィンドウと入力可能なページ数(目安) プロダクションにおける課題 コンテキストウィンドウ 入力可能なページ数 代表的なモデル 8k 16
GPT-4 32k 64 GPT-4 32k 128k 256 GPT-4o 200k 400 Claude 3.5 Sonnet 2,000k 4,000 Gemini 1.5 Pro 最低100ページは 入力したい
©MNTSQ, Ltd. 22 モデル選択 プロダクションにおける課題 GPT-4o Claude 3.5 Sonnet Gemini
1.5 Pro 契約書解析における精度 ◯ ◎ ◯ コンテキストウィンドウ 128k 200k 2,000k トークンの出力速度 ◯ ◯ △ 価格 ◯ ◎ ◎ 日本リージョンでの利用 △ ✕ ◯ 発表者の主観に基づく評価です
©MNTSQ, Ltd. 23 Lost in the Middle プロダクションにおける課題 ChatGPT -
LLMシステム開発大全 より
©MNTSQ, Ltd. 24 まだ世にベスプラが存在しない状況でいろいろ決める必要がある プロダクションにおける課題 • ソースコードとプロンプトの分離、および実験管理 ◦ どのソリューションが適切?(PromptLayer, LangSmith,
etc.) • プロンプトの効果的なレビュー方針 ◦ 何を根拠にApproveする? • 精度改善のアプローチ ◦ MLではデータ増やせばなんとかなったがプロンプトでは...? • その他、MLOpsに基づくプラクティスの適用 Q&Aや懇親会では この辺を議論できると 嬉しいです
None