$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
23回アルゴリズムコンテスト 1位解法
Search
catla
December 19, 2019
Research
6
670
23回アルゴリズムコンテスト 1位解法
2019年12月19日に大分大学で開かれたPRMU研究会における発表資料になります。
catla
December 19, 2019
Tweet
Share
More Decks by catla
See All by catla
ベイズ深層学習(6.3)
catla
2
230
ベイズ深層学習(6.2)
catla
3
230
[読み会資料] Federated Learning for Vision-and-Language Grounding Problems
catla
0
300
ベイズ深層学習(5.1~5.2)
catla
0
230
ベイズ深層学習(4.1)
catla
0
450
ベイズ深層学習(3.3~3.4)
catla
19
11k
ベイズ深層学習(2.2~2.4)
catla
6
1.3k
Learning Lightweight Lane Detection CNNs by Self Attention Distillation(ICCV2019)の紹介
catla
0
600
TGS Salt Identification Challenge 12th place solution
catla
3
11k
Other Decks in Research
See All in Research
論文読み会 SNLP2025 Learning Dynamics of LLM Finetuning. In: ICLR 2025
s_mizuki_nlp
0
340
PhD Defense 2025: Visual Understanding of Human Hands in Interactions
tkhkaeio
1
320
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
220
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
180
AWSで実現した大規模日本語VLM学習用データセット "MOMIJI" 構築パイプライン/buiding-momiji
studio_graph
2
960
20250725-bet-ai-day
cipepser
3
540
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
150
生成AI による論文執筆サポート・ワークショップ ─ サーベイ/リサーチクエスチョン編 / Workshop on AI-Assisted Paper Writing Support: Survey/Research Question Edition
ks91
PRO
0
120
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
10
6.3k
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
1.2k
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
360
【輪講資料】Moshi: a speech-text foundation model for real-time dialogue
hpprc
3
820
Featured
See All Featured
Producing Creativity
orderedlist
PRO
348
40k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
For a Future-Friendly Web
brad_frost
180
10k
Building Applications with DynamoDB
mza
96
6.8k
BBQ
matthewcrist
89
9.9k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
970
Facilitating Awesome Meetings
lara
57
6.7k
Git: the NoSQL Database
bkeepers
PRO
432
66k
[SF Ruby Conf 2025] Rails X
palkan
0
500
GitHub's CSS Performance
jonrohan
1032
470k
Automating Front-end Workflow
addyosmani
1371
200k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Transcript
ճΞϧΰϦζϜίϯςετ Ґ ղ๏ ஜେֶ ใֶ܈ ใՊֶྨ ஜେֶώϡʔϚϯίϯϐϡςʔγϣϯݚڀࣨ ॴଐ OBPLJLBUTVSB!IDPNQDTUTVLVCBBDKQ
ܡ ঘً 13.6ݚڀձ!େେֶ
ίϯςετ֓ཁ ίϯςετͷظؒɿ d ʢϲ݄ʣ ՝༰ɿ ( + 48 &
+ 3!%!% '(")accuracy* + $#+ 119,997 &#+ 16,387 1+ 388,146
લॲཧ
લॲཧ 標準正規分布の確率密度関数 を[-1, 1]の区間で等間隔で サンプリングしたベクトル。 二値化画像を横に合計を取っ たベクトルを見ると、文字部 分は山状になっている。
Ϟσϧͷશମ૾
݁Ռ 手元で評価( Cross validation )した時の認識率は、 ResNet < OctConv ResNet <
DenseNet < Inception-v4 < SE-ResNeXt となった。 モデル 認識率 OctConv ResNet50( 事前学習無し ) 89.59% SE-ResNeXt101( 事前学習有り ) 90.23% アンサンブル (SE-ResNeXt, DenseNet, Inception-v4) 90.63% 順位 最終結果のスコア 1 位 90.63% 2 位 89.35% 3 位 88.95%
Random CropやRandom Shiftといった基本的な Augmentationに加え、分割位置に対してロバストにな るように前処理によって得られた分割位置を学習時にラ ンダムで上下に少しずれるような処理を行なった。 また、学習率のスケジューリングをWarmupとRestart有 りCosine Annealingにすることで収束速度と精度が共に
向上した。
࣮ݧઃఆ ࠷ऴతʹɺϞσϧͷΞϯαϯϒϧʢՃॏฏۉʣͨ͠ͷ͕࠷ߴਫ਼ͱͳͬͨɻϞσϧɺಛྔந ग़Λߦ͏CBDLCPOF͕ҟͳΔ͚ͩͰ͋Γɺ͜ΕΒશͯ*NBHF/FUͰࣄલֶश͞Ε͍ͯΔɻ ˔ CBDLCPOFɿ 4&3FT/F9U %FOTF/FU *ODFQUJPOW ˔ ଛࣦؔɿ
$SPTT&OUSPQZ-PTT ˔ όοναΠζɿ ˔ ࠷దԽؔɿ NPNFOUVN4(%ʢNPNFOUVN XFJHIUEFDBZʣ ˔ εέδϡʔϥɿ 4(%3ʢMSɿd FQPDIDZDMFʣ ˔ ೖྗղ૾ɿY ˔ FQPDIɿ ˔ (16ɿ 5FTMBW (# (59 (# ˔ ͦͷଞɿ.JYFE1SFDJTJPOͰֶश
·ͱΊ • モデルは、特徴量抽出器としてImageNet等で成果を出しているCNNアーキテクチャ、クラス分類 器としては、隣接した画像の特徴を考慮するためにGRUを使用したネットワークを結合した構成。 • 前処理では、大津の二値化をしようして、良さそうな分割位置を推定。 • 分割位置に対してモデルがロバストに学習できるように学習時にランダムで位置を変化させる。 • 学習率をSGDRで変化させると大幅に精度と収束速度が上昇。
• 最も精度が高くなったモデルは、SE-ResNeXt, DenseNet, Inception-v4をアンサンブルさせたモ デル。 コードは公開しております。 https://github.com/katsura-jp/alcon23