Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文「Sentence Boundary Detection in Legal Text」のまとめ
Search
sunao11
September 15, 2020
Technology
1
120
論文「Sentence Boundary Detection in Legal Text」のまとめ
論文「Sentence Boundary Detection in Legal Text」のまとめです。
法律文書をセンテンスで区切る場合に、通常の自然言語処理と違うアプローチを行います。
sunao11
September 15, 2020
Tweet
Share
More Decks by sunao11
See All by sunao11
一般社団法人のガバナンスー一般社団法人民事推進センターの社員の除名を経験してー
sunao11
0
100
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)
sunao11
1
32
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)。
sunao11
1
34
論文まとめ:SoftPoolNet: Shape Descriptor for Point Cloud Completion and Classification
sunao11
0
130
論文Title:Privacy Preserving Structure -from-Motionのまとめ
sunao11
0
120
論文タイトル:DeepSFM: Structure From Motion Via Deep Bundle Adjustmentのまとめ
sunao11
1
170
渉外司法書士のための金融法務と海外送金 研修受講メモ
sunao11
1
86
自筆証書遺言書保管制度についてのQ&A(試訳) Q&A about self-signed will testamentary keeping system.(The trial translation)
sunao11
0
74
商業登記所における法人の実質的支配者 情報の把握促進に関する研究会~有識者 による議論の取りまとめ~(試訳)
sunao11
1
60
Other Decks in Technology
See All in Technology
エンジニアが加速させるプロダクトディスカバリー 〜最速で価値ある機能を見つける方法〜 / product discovery accelerated by engineers
rince
4
370
データ資産をシームレスに伝達するためのイベント駆動型アーキテクチャ
kakehashi
PRO
2
550
Larkご案内資料
customercloud
PRO
0
650
アジャイル開発とスクラム
araihara
0
170
(機械学習システムでも) SLO から始める信頼性構築 - ゆる SRE#9 2025/02/21
daigo0927
0
130
PHPで印刷所に入稿できる名札データを作る / Generating Print-Ready Name Tag Data with PHP
tomzoh
0
110
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
6
57k
白金鉱業Meetup Vol.17_あるデータサイエンティストのデータマネジメントとの向き合い方
brainpadpr
6
760
Goで作って学ぶWebSocket
ryuichi1208
2
1.3k
技術的負債解消の取り組みと専門チームのお話 #技術的負債_Findy
bengo4com
1
1.3k
デスクトップだけじゃないUbuntu
mtyshibata
0
110
レビューを増やしつつ 高評価維持するテクニック
tsuzuki817
1
730
Featured
See All Featured
Building an army of robots
kneath
303
45k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Rebuilding a faster, lazier Slack
samanthasiow
80
8.8k
A Philosophy of Restraint
colly
203
16k
KATA
mclloyd
29
14k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
Fontdeck: Realign not Redesign
paulrobertlloyd
83
5.4k
RailsConf 2023
tenderlove
29
1k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.1k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Gamification - CAS2011
davidbonilla
80
5.1k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2.1k
Transcript
Title:Sentence Boundary Detection in Legal Text ・一般的に使用されている半教師付きとルールベースのライブラリ、および 2つの教師付きシーケンスラベリングア プローチを提案 まとめた人:宮城直
提案手法・新規性 ・略語リスト、文頭ラベル、文末ラベルなどを追加 し更新することで,精度を改善
結果 ・Punkt(PunktSentenceTokenizer)モデルの更新前と更新後( カスタム略語を追加して学習) の比較 ・実験の精度(Precision), 再現率(Recall), 加重平均(F1-score), 要素数(Support) 図
Oral結果 ・CRF(Conditional random field)モデルアプローチが現在、実用的なアプローチ ・完全教師付きアプローチが半教師付きルールライブラリよりも優れている
+αの情報 ・George Sanchez[https://scholar.google.com/citations?user=Gk65NcEAAAAJ&hl=en], Thomson Reuters R&D,610 Opperman Dr. Eagan, MN
55123 ・データセット:[https://github.com/jsavelka/sbd_adjudicatory_dec / tree / master / data_set] [bva.json、cyber_crime.json、intellectual_property.json、scotus.json]