Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
110
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
0
1.3k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
0
530
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
0
150
銀_kaggle_火山コンペ_20230615
sugupoko
0
520
反省_kaggle_時系列データ_202305_手話コンペ
sugupoko
0
430
10位_202304_超解像コンペ_solafune_衛星画像の超解像
sugupoko
0
180
銀_202302_kaggle_NFL_Player_contact_detection
sugupoko
0
140
銀_1D時系列データ分類_202212_nishika_睡眠コンペ
sugupoko
0
350
反省_アルゴコンペ_202208_kaggle_DFL
sugupoko
0
160
Other Decks in Research
See All in Research
3次元点群の分類における評価指標について
kentaitakura
0
430
文化が形作る音楽推薦の消費と、その逆
kuri8ive
0
160
LLM時代にLabは何をすべきか聞いて回った1年間
hargon24
1
500
テキストマイニングことはじめー基本的な考え方からメディアディスコース研究への応用まで
langstat
1
120
大規模言語モデルのバイアス
yukinobaba
PRO
4
700
システムから変える 自分と世界を変えるシステムチェンジの方法論 / Systems Change Approaches
dmattsun
3
860
湯村研究室の紹介2024 / yumulab2024
yumulab
0
280
Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices
masakat0
0
220
クロスセクター効果研究会 熊本都市交通リノベーション~「車1割削減、渋滞半減、公共交通2倍」の実現へ~
trafficbrain
0
260
情報処理学会関西支部2024年度定期講演会「自然言語処理と大規模言語モデルの基礎」
ksudoh
6
770
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
21
3.5k
医療支援AI開発における臨床と情報学の連携を円滑に進めるために
moda0
0
110
Featured
See All Featured
XXLCSS - How to scale CSS and keep your sanity
sugarenia
246
1.3M
GraphQLとの向き合い方2022年版
quramy
43
13k
BBQ
matthewcrist
85
9.3k
The Cult of Friendly URLs
andyhume
78
6k
Facilitating Awesome Meetings
lara
50
6.1k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
What's new in Ruby 2.0
geeforr
343
31k
Git: the NoSQL Database
bkeepers
PRO
427
64k
How GitHub (no longer) Works
holman
310
140k
Faster Mobile Websites
deanohume
305
30k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー