Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
120
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
0
1.5k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
0
580
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
0
170
銀_kaggle_火山コンペ_20230615
sugupoko
0
540
反省_kaggle_時系列データ_202305_手話コンペ
sugupoko
0
460
10位_202304_超解像コンペ_solafune_衛星画像の超解像
sugupoko
0
190
銀_202302_kaggle_NFL_Player_contact_detection
sugupoko
0
150
銀_1D時系列データ分類_202212_nishika_睡眠コンペ
sugupoko
0
360
反省_アルゴコンペ_202208_kaggle_DFL
sugupoko
0
170
Other Decks in Research
See All in Research
Neural Fieldの紹介
nnchiba
1
550
KDD論文読み会2024: False Positive in A/B Tests
ryotoitoi
0
270
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
280
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
420
コミュニティドライブプロジェクト
smartfukushilab1
0
120
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
460
Weekly AI Agents News! 10月号 論文のアーカイブ
masatoto
1
460
機械学習でヒトの行動を変える
hiromu1996
1
450
한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성
inureyes
PRO
0
150
Weekly AI Agents News! 11月号 プロダクト/ニュースのアーカイブ
masatoto
0
260
FOSS4G 山陰 Meetup 2024@砂丘 はじめの挨拶
wata909
1
140
LLM時代にLabは何をすべきか聞いて回った1年間
hargon24
1
590
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
570
Speed Design
sergeychernyshev
25
740
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Code Review Best Practice
trishagee
65
17k
Documentation Writing (for coders)
carmenintech
67
4.5k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.5k
Music & Morning Musume
bryan
46
6.3k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
A Philosophy of Restraint
colly
203
16k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー