Web系企業研究所における研究開発を加速させるエコシステム / Ecosystem accelerates our R&D in CyberAgent AI Lab

Web系企業研究所における研究開発を加速させるエコシステム PRMU研究会 20211008 Yuki IWAZAKI@chck / CyberAgent AI Lab

Hello! I am Yuki IWAZAKI@chck ◦ 2014...Backend Engineer in DSP
└2018-...Research Engineer in AI Lab ◦ Ad x Multimedia (Vision & Language) 2

CyberAgentの事業領域 3

AI Labの立ち位置 4

CyberAgent AI Labについて 2016年に設立された研究組織 30名以上のResearch Scientist, Engineerが在籍今年の論文投稿数99件 (acceptance: 31.3%)
https://cyberagent.ai/ailab/ 5

組織体制 AI Lab Creative Group Human-computer interaction Econ & Optimization
Creative Research NLP Applied ML Algorithms Graphics Audio Media Fundamentals Econ Research Econ Social Implementation Reinforcement Learning 6

AI LabにおけるR&Dの進め方 • 学術貢献 -> 論文投稿, 学会発表, 特許 ◦ Proposal
ﬁrst, Bottom up ▪ 会社の事業領域に関連する基礎, 応用研究 • 事業貢献 -> コンサル, EDA, Modeling ◦ Task ﬁrst, Top down ▪ プロダクトと連携して課題解決 7

AI LabにおけるR&Dの進め方 • 学術貢献 -> 論文投稿, 学会発表 ◦ Proposal ﬁrst,
Bottom up ▪ 会社の事業領域に関連する基礎, 応用研究 • 事業貢献 -> コンサル, EDA, Modeling ◦ Task ﬁrst, Top down ▪ プロダクトと連携して課題解決 8

共通のML基盤を持たないAI事業本部広い事業領域 - over 20 products 少数精鋭の開発チーム - 5-15名/product 裁量権は各チームに
- 技術選定からプロセスまでメンバーで決定 9

プロダクトとの連携例タスク相談モデル実装データ提供実験レポート共有プロダクトA AI Lab 専門的なFeedback 産学連携先
研究室データ提供タスク相談専門的なFeedback モデル実装実験レポート共有 10

プロダクトとの連携例2 タスク相談モデル実装データ提供実験レポート共有プロダクトB AI Lab 専門的なFeedback 途中から参戦
データ提供専門的なFeedback AI Lab 11

研究組織における3つの課題 1. データ管理 2. モデル管理 3. 実験管理 12

1. データ管理

課題: データ管理 • データ形式がProduct/Project毎に違う ◦ CSV, JSON, S3, RDB, BigQuery,
etc… ◦ Domain知識フル動員な鬼Query • 前処理の共有や冪等性担保が困難 ◦ 属人的で難解なREADME ◦ 先人の実験時とレコード数が違う ◦ リーダブルコーディングが浸透しづらい ◦ 新メンバーやインターンの学習コスト高 preprocess preprocess preprocess product_a dataset_c product_b 14

解決: tensorﬂow-datasets • Public/Private Dataset loader ◦ 社内GitHubからpip installで利用 •
特徴 ◦ データの読込, 追加が簡単 ◦ ProductやProjectの単位でVersioning ◦ Apache Beamによる並列分散処理 product_a product_b dataset_c product_a dataset_c product_b ailab-datasets 15

tensorﬂow-datasets: load tf.dataやnumpy, pandas形式でloadできる 16

tensorﬂow-datasets: load tf.dataやnumpy, pandas形式でloadできる 17 Datasetを指定 Iterationの定義

tensorﬂow-datasets: load tf.dataやnumpy, pandas形式でloadできる 18 tf.data numpy pandas

tensorﬂow-datasets: create tfds cliからtemplateを生成 19

21 Versioning Metadata. カラムの型の定義データの説明文引用論文のURL データのダウンロード分割方法の指定前処理含むGenerator

23 前処理含むGenerator (apache-beam pipeline)

ailab-datasets: list product_a product_b ailab_datasets/ ┣products/ ┃┣product_a ┃┗product_b ┣image_classiﬁcation/ ┃┗imagenet
┗text_generation/ https://www.tensorflow.org/datasets/catalog/overview 25

2. モデル管理

課題: モデル管理 • モデルの再発明が多発 ◦ 似たタスク前に誰かがやっていたような ◦ benchmark取りたいが再実装した方が早そう • 研究者間でモデルの重みシェアしたい
◦ 既にどんなモデルがあるか把握しづらい ◦ Aさんの学習済モデルはBさんのテーマで応用できるかも • Public pre-trained modelのprivate版がほしい ◦ ResNet(on imagenet)やBERT(on jawiki)の社内データ版 27

解決: AI Hub tensorﬂow-hubのManaged版であるAI Hub(GCP)を利用学習済モデルやNotebookがPrivateに共有可能 28

AI Hub 実体はuploadしたobjectの検索service Metadataを入力し共有したいobjectをupload tf.hubのself-hostingも可能だが現状はCloud版であるAI Hubで必要十分 tensorﬂow/hub/issues/266 29

AI Hub 検索機能付きで管理しやすく,Downloadして利用 30 Public model Private model

3. 実験管理

課題: 実験管理 Teamや個人で実験管理がしたい Free: MLﬂow, Keepsake, TensorBoard SaaS: Neptune.ai, Comet.ml,
Wandb MLﬂowはServer構築が面倒 SaaS系は個人の無料枠を超えると高い 32

課題: 実験管理 MLﬂow Serverを1つ立てて使い回しでもよいが, Experiments枠で各Userの実験を混ぜると煩雑個人やチーム単位で1MLﬂowあるとBetter 33 ▪ Write ▪
Read

解決: MLflow Cluster • AI Lab共通のMLflow Clusterを構築 • 特徴 ◦
実験管理は各人独立したendpointを提供 ◦ OSSのMLflow Tracking ServerをLab PrivateでHosting ◦ GCP Resourceで各ユーザはCost/Server管理要らず ◦ Google Account Whitelistで共同研究先との利用にも 34

Cloud IAPによるユーザ認証 39 Not Authorized

利用の流れ 1.利用希望者の$user endpointを作成 2.Training codeからOAuth Token発行 3.Serverに向けて実験ログを飛ばす 4.${MLFLOW_HOST}/${USER}にアクセス 5.実験結果を自由に管理 40

MLﬂow Cluster構築ハンズオン Blog公開したのでぜひ https://cyberagent.ai/blog/research/15272/ 41

Summary - 実験の流れ - Data (tensorﬂow-datasets) - -> Preprocess (tft,
tf.data, numpy, pandas) - -> Training (ai platform training) - -> Save model (AI Hub) - -> Report (MLﬂow) OSSを上手くwrapすることでメンテコストを抑えた実験サポート環境を実現 42

We’re Hiring! (学生の方向け) 44

We’re Hiring! (学生の方向け) 45

We’re Hiring! (社会人の方向け) 46

We’re Hiring! (社会人の方向け) 47

48 Thanks! Any questions? You can ﬁnd me at: ◦
github.com/chck ◦ [email protected]

Web系企業研究所における研究開発を加速させるエコシステム / Ecosystem accel...

Web系企業研究所における研究開発を加速させるエコシステム / Ecosystem accelerates our R&D in CyberAgent AI Lab

More Decks by chck

Other Decks in Research

Featured

Transcript