Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文「Sentence Boundary Detection in Legal Text」のまとめ
Search
sunao11
September 15, 2020
Technology
1
150
論文「Sentence Boundary Detection in Legal Text」のまとめ
論文「Sentence Boundary Detection in Legal Text」のまとめです。
法律文書をセンテンスで区切る場合に、通常の自然言語処理と違うアプローチを行います。
sunao11
September 15, 2020
Tweet
Share
More Decks by sunao11
See All by sunao11
一般社団法人のガバナンスー一般社団法人民事推進センターの社員の除名を経験してー
sunao11
0
140
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)
sunao11
1
65
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)。
sunao11
1
65
論文まとめ:SoftPoolNet: Shape Descriptor for Point Cloud Completion and Classification
sunao11
0
170
論文Title:Privacy Preserving Structure -from-Motionのまとめ
sunao11
0
150
論文タイトル:DeepSFM: Structure From Motion Via Deep Bundle Adjustmentのまとめ
sunao11
1
200
渉外司法書士のための金融法務と海外送金 研修受講メモ
sunao11
1
110
自筆証書遺言書保管制度についてのQ&A(試訳) Q&A about self-signed will testamentary keeping system.(The trial translation)
sunao11
0
100
商業登記所における法人の実質的支配者 情報の把握促進に関する研究会~有識者 による議論の取りまとめ~(試訳)
sunao11
1
96
Other Decks in Technology
See All in Technology
Agile Leadership Summit Keynote 2026
m_seki
1
570
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
Cosmos World Foundation Model Platform for Physical AI
takmin
0
770
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.4k
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
2
340
データの整合性を保ちたいだけなんだ
shoheimitani
8
3.1k
15 years with Rails and DDD (AI Edition)
andrzejkrzywda
0
180
Frontier Agents (Kiro autonomous agent / AWS Security Agent / AWS DevOps Agent) の紹介
msysh
3
160
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
170
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
2
180
GitHub Issue Templates + Coding Agentで簡単みんなでIaC/Easy IaC for Everyone with GitHub Issue Templates + Coding Agent
aeonpeople
1
200
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
290
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
110
A Modern Web Designer's Workflow
chriscoyier
698
190k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.1k
Believing is Seeing
oripsolob
1
53
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
100
The browser strikes back
jonoalderson
0
360
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
55
Balancing Empowerment & Direction
lara
5
880
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Transcript
Title:Sentence Boundary Detection in Legal Text ・一般的に使用されている半教師付きとルールベースのライブラリ、および 2つの教師付きシーケンスラベリングア プローチを提案 まとめた人:宮城直
提案手法・新規性 ・略語リスト、文頭ラベル、文末ラベルなどを追加 し更新することで,精度を改善
結果 ・Punkt(PunktSentenceTokenizer)モデルの更新前と更新後( カスタム略語を追加して学習) の比較 ・実験の精度(Precision), 再現率(Recall), 加重平均(F1-score), 要素数(Support) 図
Oral結果 ・CRF(Conditional random field)モデルアプローチが現在、実用的なアプローチ ・完全教師付きアプローチが半教師付きルールライブラリよりも優れている
+αの情報 ・George Sanchez[https://scholar.google.com/citations?user=Gk65NcEAAAAJ&hl=en], Thomson Reuters R&D,610 Opperman Dr. Eagan, MN
55123 ・データセット:[https://github.com/jsavelka/sbd_adjudicatory_dec / tree / master / data_set] [bva.json、cyber_crime.json、intellectual_property.json、scotus.json]