Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文「Sentence Boundary Detection in Legal Text」のまとめ
Search
sunao11
September 15, 2020
Technology
1
150
論文「Sentence Boundary Detection in Legal Text」のまとめ
論文「Sentence Boundary Detection in Legal Text」のまとめです。
法律文書をセンテンスで区切る場合に、通常の自然言語処理と違うアプローチを行います。
sunao11
September 15, 2020
Tweet
Share
More Decks by sunao11
See All by sunao11
一般社団法人のガバナンスー一般社団法人民事推進センターの社員の除名を経験してー
sunao11
0
140
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)
sunao11
1
76
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)。
sunao11
1
73
論文まとめ:SoftPoolNet: Shape Descriptor for Point Cloud Completion and Classification
sunao11
0
170
論文Title:Privacy Preserving Structure -from-Motionのまとめ
sunao11
0
150
論文タイトル:DeepSFM: Structure From Motion Via Deep Bundle Adjustmentのまとめ
sunao11
1
200
渉外司法書士のための金融法務と海外送金 研修受講メモ
sunao11
1
120
自筆証書遺言書保管制度についてのQ&A(試訳) Q&A about self-signed will testamentary keeping system.(The trial translation)
sunao11
0
110
商業登記所における法人の実質的支配者 情報の把握促進に関する研究会~有識者 による議論の取りまとめ~(試訳)
sunao11
1
99
Other Decks in Technology
See All in Technology
めちゃくちゃ開発するQAエンジニアになって感じたメリットとこれからの課題感
ryuhei0000yamamoto
0
130
わからなくて良いなら、わからなきゃだめなの?
kotaoue
1
370
[E2]CCoEはAI指揮官へ。Bedrock×MCPで構築するコスト・セキュリティ自律運用基盤
taku1418
0
190
夢の無限スパゲッティ製造機 #phperkaigi
o0h
PRO
0
150
Tebiki Engineering Team Deck
tebiki
0
27k
20260311 技術SWG活動報告(デジタルアイデンティティ人材育成推進WG Ph2 活動報告会)
oidfj
0
360
OCI技術資料 : コンピュート・サービス 概要
ocise
4
54k
S3はフラットである –AWS公式SDKにも存在した、 署名付きURLにおけるパストラバーサル脆弱性– / JAWS DAYS 2026
flatt_security
0
1.8k
Goのerror型がシンプルであることの恩恵について理解する
yamatai1212
1
210
スクリプトの先へ!AIエージェントと組み合わせる モバイルE2Eテスト
error96num
0
190
"作る"から"使われる"へ:Backstage 活用の現在地
sbtechnight
0
190
銀行の内製開発にて2つのプロダクトを1つのチームでスクラムしてみてる話
koba1210
1
150
Featured
See All Featured
ラッコキーワード サービス紹介資料
rakko
1
2.7M
The Mindset for Success: Future Career Progression
greggifford
PRO
0
280
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
250
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
300
Amusing Abliteration
ianozsvald
0
140
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
120
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Thoughts on Productivity
jonyablonski
75
5.1k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
130
Making Projects Easy
brettharned
120
6.6k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Transcript
Title:Sentence Boundary Detection in Legal Text ・一般的に使用されている半教師付きとルールベースのライブラリ、および 2つの教師付きシーケンスラベリングア プローチを提案 まとめた人:宮城直
提案手法・新規性 ・略語リスト、文頭ラベル、文末ラベルなどを追加 し更新することで,精度を改善
結果 ・Punkt(PunktSentenceTokenizer)モデルの更新前と更新後( カスタム略語を追加して学習) の比較 ・実験の精度(Precision), 再現率(Recall), 加重平均(F1-score), 要素数(Support) 図
Oral結果 ・CRF(Conditional random field)モデルアプローチが現在、実用的なアプローチ ・完全教師付きアプローチが半教師付きルールライブラリよりも優れている
+αの情報 ・George Sanchez[https://scholar.google.com/citations?user=Gk65NcEAAAAJ&hl=en], Thomson Reuters R&D,610 Opperman Dr. Eagan, MN
55123 ・データセット:[https://github.com/jsavelka/sbd_adjudicatory_dec / tree / master / data_set] [bva.json、cyber_crime.json、intellectual_property.json、scotus.json]