Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
日本初の競技機械学習大会 Cpaw AI Competition の運営 / About Cp...
Search
Shunsuke KITADA
December 01, 2018
Technology
7.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
日本初の競技機械学習大会 Cpaw AI Competition の運営 / About Cpaw AI Competition in Kaggle Meetup Tokyo
2018/12/1に行われたKaggle Meetup Tokyo LTの資料です。
Shunsuke KITADA
December 01, 2018
More Decks by Shunsuke KITADA
See All by Shunsuke KITADA
Anthropic が提案する LLM の内部状態を自然言語で説明可能にした Natural Language Autoencoders / Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations
shunk031
0
130
その LLM 制御、本当に信頼できますか? / Can We Reliably Control LLMs?
shunk031
2
660
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey
shunk031
4
1.1k
LLM の内部を操るベクトル?
shunk031
2
67
[堅牢.py #1] テストを書かない研究者に送る、最初にテストを書く実験コード入門 / Let's start your ML project by writing tests
shunk031
14
9.3k
AIグラフィックデザインの進化:断片から統合(One Piece)へ / From Fragment to One Piece: A Survey on AI-Driven Graphic Design
shunk031
0
660
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
shunk031
17
12k
[CV勉強会@関東 CVPR2024] Visual Layout Composer: Image-Vector Dual Diffusion Model for Design Layout Generation / kantocv 61th CVPR 2024
shunk031
2
900
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
shunk031
2
2.2k
Other Decks in Technology
See All in Technology
現場のトークンマネジメント
dak2
1
190
ロボティクスの技術 / Robotics Technology
ks91
PRO
0
140
AIはどのように 組織のアジリティを変えるのか?
junki
4
1.4k
Agile and AI Redmine Japan 2026
hiranabe
4
490
2026年6月23日 Syncable Tech + Start Python Club にて
hamukazu
0
150
秘密度ラベル初心者が第1歩でつまづかないための「設計・運用」ポイント
seafay
PRO
1
490
AI時代に求められる技術力 フロンティア・クリエイティビティ / Technical Excellence in the AI Era: Frontier Creativity
kaonavi
0
110
サイバーエージェントにおけるAI推進戦略と変革への取り組み
shotatsuge
0
570
iOS アプリの「これって不具合ですか?」を AI に調べてもらう
miichan
0
140
感情と身体を置き去りにしない、エンジニアの生きのこり方 ──いまから、ここから「自分の状態」を扱うという選択
saorimurooka
0
340
“詰む”前に仕組みを作れ 〜技術の波に溺れないためのキャッチアップ術〜
takasyou
7
3.9k
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
3
840
Featured
See All Featured
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
The SEO identity crisis: Don't let AI make you average
varn
0
500
Practical Orchestrator
shlominoach
191
11k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Technical Leadership for Architectural Decision Making
baasie
3
420
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
220
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
1k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Marketing to machines
jonoalderson
1
5.5k
Designing Experiences People Love
moore
143
24k
Transcript
日本初の競技機械学習大会 “Cpaw AI Competition”の運営 Kaggle Tokyo Meetup #5 LT 2018.12.1
しゅんけー (@shunk031) 1
自己紹介 • 北田 俊輔 (Shunsuke KITADA) @shunk031 shunk031 ◦ 法政大学
理工学研究科 M1 彌冨研 所属 ▪ 文字形状に着目したCJK自然言語処理 ▪ 皮膚障害画像を用いた自動診断システムの構築 ▪ 広告自動生成に向けた基礎研究 ◦ opt (現SIGNATE) ユニクロコン 学生賞受賞 ◦ Kaggleは初心者です 2
3 日本初の競技機械学習大会 “Cpaw AI Competition”の運営
4 日本初の競技機械学習大会 “Cpaw AI Competition”の運営 リアルタイム
Cpaw (シーパウ) とは • 工学院大学・法政大学の学生で立ち上げたIT団体 ◦ 月1回でLT大会を開催 ▪ CpawLT /
CpawLT Night ◦ セキュリティコンテストの運営 ▪ CpawCTF https://ctf.cpaw.site/ ◦ オープンソースカンファレンスへの出展 ▪ 走る!自動販売機 IoTロボットアーム ◦ CpawでHackU最優秀賞を授与 ▪ Cash Box - 顔認証・音声認識搭載 スマートボックス 5
Cpaw AI Competition (CpawAIC) とは • 日本初の ”リアルタイム” 競技機械学習大会 ◦
Cpaw主催・全脳アーキテクチャ若手の会*共催 ◦ 限られた時間内で様々なデータセットの識別器を構築 ◦ 構築した識別器をもとに精度 (accuracy) を競う ◦ 競技終了後に上位者表彰 (景品贈呈) & 作問者から問題の解説 6 *全脳アーキテクチャ若手の会 https://wbawakate.jp/
CpawAICの競技概要 • 競技の流れ 1. 複数種類のトレーニングセットとテストセットが与えられる 2. 与えられたトレーニングセットを用いて識別器を構築 3. テストデータに対して予測を行い、スコアサーバーに提出 •
競技環境 ◦ スポンサーのさくらインターネット様からご提供いただいた 12Core・96GB RAMのハイスペックマシン • 競技時間 ◦ 5時間程度 7
CpawAICの問題概要 8 • 第1回大会 • 古代文字の分類 画像 • ファッションアイテムの分類 画像
• 芸能人ブログ記事の分類 自然言語 • マルウェアの分類 JSON形式 • 悪意のあるURLの分類 文字列
CpawAICの問題概要 9 • 第2回大会 • One-shot Omniglot 画像 • じゃんけんの手分類
画像 • ラベルシャッフルCIFAR100 画像 • プログラミング言語判定 文字列
CpawAICの問題概要 10 • 第3回大会 • 立っている指の本数を分類 画像 • 航空写真のスペクトル分類 画像
• 観光地情報を用いた分類 テーブル
CpawAICの問題概要 11 • 第3回大会 • 立っている指の本数を分類 画像 • 航空写真のスペクトル分類 画像
• 観光地情報を用いた分類 テーブル 正直エグい量の問題を出してると反省しています
CpawAICの運営 • 運営メンバーと大会開催までの道のり • 競技用データセットの作成 • スコアサーバーの開発 • CpawAICのスポンサー様 12
CpawAICの運営 • 運営メンバーと大会開催までの道のり ◦ 学生 4人程度・社会人 2人程度 ▪ 運営メンバー全員が機械学習のバックグラウンドあり ◦
プロジェクトマネージャーを立てて運営計画を実行 ▪ 半年ごとに開催をベースに計画を立てる • 競技用データセットの提案と作成 • スコアサーバーの開発 • プレコンペの実施とその振り返り • 開催場所の調整と準備 13
CpawAIC競技用データセットの作成 • データセットはCIで チェック & 動作確認 を自動化 ◦ 元データ取得スクリプト ◦
データセット生成スクリプト ◦ トレーニングセットのファイル名 ◦ ディレクトリ構成のチェック ◦ 正解データのフォーマット 14 競技用データセットの整合性を保つ 人手を必要としないデータセットの整備
CpawAICスコアサーバーの作成・運用 • Golang Revel & Vue.js 構成のスコアサーバー ◦ 管理画面 ◦
ユーザー認証 ◦ 問題一覧 ◦ リーダーボード ◦ 解答ファイル管理 15
CpawAICのスポンサー様 • 複数の企業様がスポンサーとして協力 (順不同) ◦ さくらインターネット株式会社 様 ◦ 株式会社インターネットイニシアティブ 様
◦ 株式会社いい生活 様 ◦ 株式会社サイバーエージェント 様 • スポンサーになるメリット ◦ 優秀な機械学習人材の発見 ▪ 参加学生がスポンサー企業にインターンに行く事例も有 ◦ スポンサーセッションでの会社紹介 16
CpawAICのスポンサー様 • 様々な種類のスポンサーを募集しております ◦ 1日会場レンタル費用 (50人以上収容可能) ◦ 参加者分の計算機 (サーバー) レンタル費用
◦ 大会後の懇親会費用 • スポンサー特典 ◦ イベントでのノベルティ配布 ◦ スポンサーセッションでの会社紹介プレゼン枠 等 17 詳しくは以下のリンクを御覧ください https://www.cpaw.site/cpaw-sponser/
CpawAICの改善点 • 競技データセットの作成改善 ◦ 競技データセット作成が高コスト ▪ 既存データセットをアレンジして出題したい ◦ 配布用データと正解データの不整合 ▪
整合性をCIでチェックする機構を追加したい ▪ データセットのデプロイまでをCIでやらせたい • さらなるスコアサーバーの開発 ◦ Private LB機能がまだないです ◦ スコアサーバー開発の人材不足が深刻です 18
CpawAICの今後 • 分類問題以外の問題の作成 (回帰・ランキング予想) • オフラインで大会の過去問を解けるように公開 • 企業のデータセットを使った大会の開催 ◦ セキュリティのノウハウもあるので「セキュリティ
x AI」等 • ご協力いただける運営メンバー・スポンサーを増やしたい • 機械学習の習熟度別で大会を開催 • Kaggler-ja と協力したイベントの開催 19