Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
120
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
0
1.6k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
0
600
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
0
190
銀_kaggle_火山コンペ_20230615
sugupoko
0
560
反省_kaggle_時系列データ_202305_手話コンペ
sugupoko
0
470
10位_202304_超解像コンペ_solafune_衛星画像の超解像
sugupoko
0
190
銀_202302_kaggle_NFL_Player_contact_detection
sugupoko
0
150
銀_1D時系列データ分類_202212_nishika_睡眠コンペ
sugupoko
0
380
反省_アルゴコンペ_202208_kaggle_DFL
sugupoko
0
170
Other Decks in Research
See All in Research
JSAI NeurIPS 2024 参加報告会(AI アライメント)
akifumi_wachi
5
820
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
0
110
新規のC言語処理系を実装することによる 組込みシステム研究にもたらす価値 についての考察
zacky1972
1
320
Weekly AI Agents News! 11月号 論文のアーカイブ
masatoto
0
290
CoRL2024サーベイ
rpc
1
1.5k
The Economics of Platforms 輪読会 第1章
tomonatu8
0
140
打率7割を実現する、プロダクトディスカバリーの7つの極意(pmconf2024)
geshi0820
0
300
Data-centric AI勉強会 「ロボットにおけるData-centric AI」
haraduka
0
440
IM2024
mamoruk
0
220
한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성
inureyes
PRO
0
220
リモートワークにおけるパッシブ疲労
matsumoto_r
PRO
6
4.9k
研究を支える拡張性の高い ワークフローツールの提案 / Proposal of highly expandable workflow tools to support research
linyows
0
300
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
693
190k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
30
4.6k
Build The Right Thing And Hit Your Dates
maggiecrowley
34
2.5k
Fireside Chat
paigeccino
34
3.2k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
Practical Orchestrator
shlominoach
186
10k
4 Signs Your Business is Dying
shpigford
182
22k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.5k
How to train your dragon (web standard)
notwaldorf
91
5.8k
Building Adaptive Systems
keathley
40
2.4k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー