Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
日本初の競技機械学習大会 Cpaw AI Competition の運営 / About Cp...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Shunsuke KITADA
December 01, 2018
Technology
2
7.1k
日本初の競技機械学習大会 Cpaw AI Competition の運営 / About Cpaw AI Competition in Kaggle Meetup Tokyo
2018/12/1に行われたKaggle Meetup Tokyo LTの資料です。
Shunsuke KITADA
December 01, 2018
Tweet
Share
More Decks by Shunsuke KITADA
See All by Shunsuke KITADA
[堅牢.py #1] テストを書かない研究者に送る、最初にテストを書く実験コード入門 / Let's start your ML project by writing tests
shunk031
13
8k
AIグラフィックデザインの進化:断片から統合(One Piece)へ / From Fragment to One Piece: A Survey on AI-Driven Graphic Design
shunk031
0
600
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
shunk031
17
11k
[CV勉強会@関東 CVPR2024] Visual Layout Composer: Image-Vector Dual Diffusion Model for Design Layout Generation / kantocv 61th CVPR 2024
shunk031
1
820
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
shunk031
2
2k
[KDD2023論文読み会] BERT4CTR: An Efficient Framework to Combine Pre-trained Language Model with Non-textual Features for CTR Prediction / KDD2023 LY Tech Reading
shunk031
0
1k
Improving Prediction Performance and Model Interpretability through Attention Mechanisms from Basic and Applied Research Perspectives (Presentation for Doctoral Dissertation)
shunk031
1
770
[IR Reading 2022秋 論文紹介] Expressions Causing Differences in Emotion Recognition in Social Networking Service Documents (CIKM'22) / IR Reading 2022 Autumn
shunk031
1
2.7k
NLPの研究を加速させるAllenNLP入門 / Introduction to AllenNLP to Accelerate NLP Research
shunk031
4
4.7k
Other Decks in Technology
See All in Technology
【Oracle Cloud ウェビナー】[Oracle AI Database + Azure] AI-Ready データ戦略の最短ルート:Azure AIでビジネス データの価値を最大化
oracle4engineer
PRO
2
110
持続可能な開発のためのミニマリズム
sansantech
PRO
4
570
3リポジトリーを2ヶ月でモノレポ化した話 / How I turned 3 repositories into a monorepo in 2 months
kubode
0
110
AI Agent Standards and Protocols: a Walkthrough of MCP, A2A, and more...
glaforge
1
550
いよいよ仕事を奪われそうな波が来たぜ
kazzpapa3
2
230
Behind the Stream - How AbemaTV Engineers Build Video Apps at Scale
ygoto3
0
130
新規事業における「一部だけどコア」な AI精度改善の優先順位づけ
zerebom
0
160
Hardware/Software Co-design: Motivations and reflections with respect to security
bcantrill
1
250
全員が「作り手」になる。職能の壁を溶かすプロトタイプ開発。
hokuo
1
540
「全社導入」は結果。1人の熱狂が組織に伝播したmikanのn8n活用
sota_mikami
0
470
Vivre en Bitcoin : le tutoriel que votre banquier ne veut pas que vous voyiez
rlifchitz
0
360
kintone開発のプラットフォームエンジニアの紹介
cybozuinsideout
PRO
0
590
Featured
See All Featured
Are puppies a ranking factor?
jonoalderson
1
2.6k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
The World Runs on Bad Software
bkeepers
PRO
72
12k
How STYLIGHT went responsive
nonsquared
100
6k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
110
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
180
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
150
Unsuck your backbone
ammeep
671
58k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Ruling the World: When Life Gets Gamed
codingconduct
0
130
Transcript
日本初の競技機械学習大会 “Cpaw AI Competition”の運営 Kaggle Tokyo Meetup #5 LT 2018.12.1
しゅんけー (@shunk031) 1
自己紹介 • 北田 俊輔 (Shunsuke KITADA) @shunk031 shunk031 ◦ 法政大学
理工学研究科 M1 彌冨研 所属 ▪ 文字形状に着目したCJK自然言語処理 ▪ 皮膚障害画像を用いた自動診断システムの構築 ▪ 広告自動生成に向けた基礎研究 ◦ opt (現SIGNATE) ユニクロコン 学生賞受賞 ◦ Kaggleは初心者です 2
3 日本初の競技機械学習大会 “Cpaw AI Competition”の運営
4 日本初の競技機械学習大会 “Cpaw AI Competition”の運営 リアルタイム
Cpaw (シーパウ) とは • 工学院大学・法政大学の学生で立ち上げたIT団体 ◦ 月1回でLT大会を開催 ▪ CpawLT /
CpawLT Night ◦ セキュリティコンテストの運営 ▪ CpawCTF https://ctf.cpaw.site/ ◦ オープンソースカンファレンスへの出展 ▪ 走る!自動販売機 IoTロボットアーム ◦ CpawでHackU最優秀賞を授与 ▪ Cash Box - 顔認証・音声認識搭載 スマートボックス 5
Cpaw AI Competition (CpawAIC) とは • 日本初の ”リアルタイム” 競技機械学習大会 ◦
Cpaw主催・全脳アーキテクチャ若手の会*共催 ◦ 限られた時間内で様々なデータセットの識別器を構築 ◦ 構築した識別器をもとに精度 (accuracy) を競う ◦ 競技終了後に上位者表彰 (景品贈呈) & 作問者から問題の解説 6 *全脳アーキテクチャ若手の会 https://wbawakate.jp/
CpawAICの競技概要 • 競技の流れ 1. 複数種類のトレーニングセットとテストセットが与えられる 2. 与えられたトレーニングセットを用いて識別器を構築 3. テストデータに対して予測を行い、スコアサーバーに提出 •
競技環境 ◦ スポンサーのさくらインターネット様からご提供いただいた 12Core・96GB RAMのハイスペックマシン • 競技時間 ◦ 5時間程度 7
CpawAICの問題概要 8 • 第1回大会 • 古代文字の分類 画像 • ファッションアイテムの分類 画像
• 芸能人ブログ記事の分類 自然言語 • マルウェアの分類 JSON形式 • 悪意のあるURLの分類 文字列
CpawAICの問題概要 9 • 第2回大会 • One-shot Omniglot 画像 • じゃんけんの手分類
画像 • ラベルシャッフルCIFAR100 画像 • プログラミング言語判定 文字列
CpawAICの問題概要 10 • 第3回大会 • 立っている指の本数を分類 画像 • 航空写真のスペクトル分類 画像
• 観光地情報を用いた分類 テーブル
CpawAICの問題概要 11 • 第3回大会 • 立っている指の本数を分類 画像 • 航空写真のスペクトル分類 画像
• 観光地情報を用いた分類 テーブル 正直エグい量の問題を出してると反省しています
CpawAICの運営 • 運営メンバーと大会開催までの道のり • 競技用データセットの作成 • スコアサーバーの開発 • CpawAICのスポンサー様 12
CpawAICの運営 • 運営メンバーと大会開催までの道のり ◦ 学生 4人程度・社会人 2人程度 ▪ 運営メンバー全員が機械学習のバックグラウンドあり ◦
プロジェクトマネージャーを立てて運営計画を実行 ▪ 半年ごとに開催をベースに計画を立てる • 競技用データセットの提案と作成 • スコアサーバーの開発 • プレコンペの実施とその振り返り • 開催場所の調整と準備 13
CpawAIC競技用データセットの作成 • データセットはCIで チェック & 動作確認 を自動化 ◦ 元データ取得スクリプト ◦
データセット生成スクリプト ◦ トレーニングセットのファイル名 ◦ ディレクトリ構成のチェック ◦ 正解データのフォーマット 14 競技用データセットの整合性を保つ 人手を必要としないデータセットの整備
CpawAICスコアサーバーの作成・運用 • Golang Revel & Vue.js 構成のスコアサーバー ◦ 管理画面 ◦
ユーザー認証 ◦ 問題一覧 ◦ リーダーボード ◦ 解答ファイル管理 15
CpawAICのスポンサー様 • 複数の企業様がスポンサーとして協力 (順不同) ◦ さくらインターネット株式会社 様 ◦ 株式会社インターネットイニシアティブ 様
◦ 株式会社いい生活 様 ◦ 株式会社サイバーエージェント 様 • スポンサーになるメリット ◦ 優秀な機械学習人材の発見 ▪ 参加学生がスポンサー企業にインターンに行く事例も有 ◦ スポンサーセッションでの会社紹介 16
CpawAICのスポンサー様 • 様々な種類のスポンサーを募集しております ◦ 1日会場レンタル費用 (50人以上収容可能) ◦ 参加者分の計算機 (サーバー) レンタル費用
◦ 大会後の懇親会費用 • スポンサー特典 ◦ イベントでのノベルティ配布 ◦ スポンサーセッションでの会社紹介プレゼン枠 等 17 詳しくは以下のリンクを御覧ください https://www.cpaw.site/cpaw-sponser/
CpawAICの改善点 • 競技データセットの作成改善 ◦ 競技データセット作成が高コスト ▪ 既存データセットをアレンジして出題したい ◦ 配布用データと正解データの不整合 ▪
整合性をCIでチェックする機構を追加したい ▪ データセットのデプロイまでをCIでやらせたい • さらなるスコアサーバーの開発 ◦ Private LB機能がまだないです ◦ スコアサーバー開発の人材不足が深刻です 18
CpawAICの今後 • 分類問題以外の問題の作成 (回帰・ランキング予想) • オフラインで大会の過去問を解けるように公開 • 企業のデータセットを使った大会の開催 ◦ セキュリティのノウハウもあるので「セキュリティ
x AI」等 • ご協力いただける運営メンバー・スポンサーを増やしたい • 機械学習の習熟度別で大会を開催 • Kaggler-ja と協力したイベントの開催 19