Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
110
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
0
1.2k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
0
510
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
0
140
銀_kaggle_火山コンペ_20230615
sugupoko
0
500
反省_kaggle_時系列データ_202305_手話コンペ
sugupoko
0
410
10位_202304_超解像コンペ_solafune_衛星画像の超解像
sugupoko
0
170
銀_202302_kaggle_NFL_Player_contact_detection
sugupoko
0
130
銀_1D時系列データ分類_202212_nishika_睡眠コンペ
sugupoko
0
330
反省_アルゴコンペ_202208_kaggle_DFL
sugupoko
0
160
Other Decks in Research
See All in Research
第28回 著者ゼミ:Identification of drug responsible glycogene signature in liver carcinoma from meta-analysis using RNA-seq data
ktatsuya
2
240
Weekly AI Agents News! 7月号 論文のアーカイブ
masatoto
1
190
WikipediaやYouTubeにおける論文参照 / joss2024
corgies
1
250
Weekly AI Agents News! 6月号 論文のアーカイブ
masatoto
1
160
第60回名古屋CV・PRML勉強会:CVPR2024論文紹介(AM-RADIO)
naok615
0
220
研究の進め方 ランダムネスとの付き合い方について
joisino
PRO
47
16k
SSII2024 [OS2] 大規模言語モデルと基盤モデルの射程
ssii
PRO
0
480
ヘルプデスクの事例で学ぶAIエージェント
masatoto
14
7.7k
JMED-LLM: 日本語医療LLM評価データセットの公開
fta98
4
1k
RSJ2024「基盤モデルの実ロボット応用」チュートリアルA(河原塚)
haraduka
2
570
Language is primarily a tool for communication rather than thought
ryou0634
4
670
第60回名古屋CV・PRMU勉強会:CVPR2024論文紹介(Vision Transformer)
waka_90b
1
170
Featured
See All Featured
Building Adaptive Systems
keathley
37
2.1k
How GitHub Uses GitHub to Build GitHub
holman
473
290k
Visualization
eitanlees
143
15k
It's Worth the Effort
3n
183
27k
Why Our Code Smells
bkeepers
PRO
334
57k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
7
550
Building Applications with DynamoDB
mza
90
6k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9k
The Brand Is Dead. Long Live the Brand.
mthomps
53
38k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
355
29k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
44
2k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー