Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文「Sentence Boundary Detection in Legal Text」のまとめ
Search
sunao11
September 15, 2020
Technology
1
140
論文「Sentence Boundary Detection in Legal Text」のまとめ
論文「Sentence Boundary Detection in Legal Text」のまとめです。
法律文書をセンテンスで区切る場合に、通常の自然言語処理と違うアプローチを行います。
sunao11
September 15, 2020
Tweet
Share
More Decks by sunao11
See All by sunao11
一般社団法人のガバナンスー一般社団法人民事推進センターの社員の除名を経験してー
sunao11
0
120
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)
sunao11
1
46
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)。
sunao11
1
47
論文まとめ:SoftPoolNet: Shape Descriptor for Point Cloud Completion and Classification
sunao11
0
150
論文Title:Privacy Preserving Structure -from-Motionのまとめ
sunao11
0
130
論文タイトル:DeepSFM: Structure From Motion Via Deep Bundle Adjustmentのまとめ
sunao11
1
190
渉外司法書士のための金融法務と海外送金 研修受講メモ
sunao11
1
99
自筆証書遺言書保管制度についてのQ&A(試訳) Q&A about self-signed will testamentary keeping system.(The trial translation)
sunao11
0
90
商業登記所における法人の実質的支配者 情報の把握促進に関する研究会~有識者 による議論の取りまとめ~(試訳)
sunao11
1
73
Other Decks in Technology
See All in Technology
Observability infrastructure behind the trillion-messages scale Kafka platform
lycorptech_jp
PRO
0
130
Definition of Done
kawaguti
PRO
6
450
TechLION vol.41~MySQLユーザ会のほうから来ました / techlion41_mysql
sakaik
0
140
Claude Code Actionを使ったコード品質改善の取り組み
potix2
PRO
2
960
標準技術と独自システムで作る「つらくない」SaaS アカウント管理 / Effortless SaaS Account Management with Standard Technologies & Custom Systems
yuyatakeyama
2
960
活きてなかったデータを活かしてみた話 / Shirokane Kougyou vol 19
sansan_randd
1
400
Amazon S3標準/ S3 Tables/S3 Express One Zoneを使ったログ分析
shigeruoda
2
370
_第3回__AIxIoTビジネス共創ラボ紹介資料_20250617.pdf
iotcomjpadmin
0
140
AWS CDK 実践的アプローチ N選 / aws-cdk-practical-approaches
gotok365
4
440
Snowflake Summit 2025全体振り返り / Snowflake Summit 2025 Overall Review
mtpooh
2
180
AI技術トレンド勉強会 #1MCPの基礎と実務での応用
nisei_k
1
240
強化されたAmazon Location Serviceによる新機能と開発者体験
dayjournal
2
140
Featured
See All Featured
A Tale of Four Properties
chriscoyier
159
23k
Facilitating Awesome Meetings
lara
54
6.4k
How to Ace a Technical Interview
jacobian
277
23k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Making Projects Easy
brettharned
116
6.2k
How to train your dragon (web standard)
notwaldorf
92
6.1k
4 Signs Your Business is Dying
shpigford
184
22k
Practical Orchestrator
shlominoach
188
11k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Transcript
Title:Sentence Boundary Detection in Legal Text ・一般的に使用されている半教師付きとルールベースのライブラリ、および 2つの教師付きシーケンスラベリングア プローチを提案 まとめた人:宮城直
提案手法・新規性 ・略語リスト、文頭ラベル、文末ラベルなどを追加 し更新することで,精度を改善
結果 ・Punkt(PunktSentenceTokenizer)モデルの更新前と更新後( カスタム略語を追加して学習) の比較 ・実験の精度(Precision), 再現率(Recall), 加重平均(F1-score), 要素数(Support) 図
Oral結果 ・CRF(Conditional random field)モデルアプローチが現在、実用的なアプローチ ・完全教師付きアプローチが半教師付きルールライブラリよりも優れている
+αの情報 ・George Sanchez[https://scholar.google.com/citations?user=Gk65NcEAAAAJ&hl=en], Thomson Reuters R&D,610 Opperman Dr. Eagan, MN
55123 ・データセット:[https://github.com/jsavelka/sbd_adjudicatory_dec / tree / master / data_set] [bva.json、cyber_crime.json、intellectual_property.json、scotus.json]