Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LINEヤフーの機械学習エンジニアはどんな仕事?

 LINEヤフーの機械学習エンジニアはどんな仕事?

More Decks by LINEヤフー株式会社 採用情報

Other Decks in Technology

Transcript

  1. © LY Corporation データグループ DS統括本部 5本部 2 高濱 修輔 Shusuke

    Takahama • 2019/03 東京大学 工学部機械情報工学科 卒業 • 2021/03 東京大学大学院 情報理工学系研究科 知能機械情報学専攻 卒業(修士) • 原田研究室 • 医療画像解析 • 2021/04 LINE株式会社 新卒入社 • 2023/10 合併してLINEヤフー株式会社に • 音楽(オーケストラでオーボエを吹いたり、アカペラバンドで歌ったり) • 会社の同僚と週一で皇居ランニング 経歴 趣味 2019/03 東京大学 工学部機械情報工学科 卒業 2021/03 東京大学大学院 情報理工学系研究科 知能機械情報学専攻 卒業(修士) • 原田研究室 • 主に医療画像解析を研究 2021/04 LINE株式会社 新卒入社 2023/10 合併してLINEヤフー株式会社に • 今ちょうど新卒4年
  2. © LY Corporation Multi-Stage Pathological Image Classification Using Semantic Segmentation

    (ICCV2019 Accepted) 卒論が国際学会ICCV2019に採択されたので ソウルに行ってきた – はてなブログ 3 卒論 自己紹介:学生時代の研究 Domain Adaptive Multiple Instance Learning for Instance-level Prediction of Pathological Images (ISBI 2023 Accepted, Oral) 修論が国際学会ISBI2023に採択されたのでコロンビア のカルタヘナに行ってきた【1泊6日】 - note 修論
  3. © LY Corporation 5 宣伝 ※原題:Privacy-Preserving Machine Learning 本が出ます! 著:

    J. Morris Chang 他 訳: 高橋翼、吉永尊洸、高濱修輔、長谷川聡 https://www.amazon.co.jp/dp/4320125878 機械学習のためのプライバシー保護 機械学習モデルの性能を保ちつつ、データ提供者のプライバシーを 保護する手法として注目されるDifferential Privacy (DP) について 基礎から応用まで実例を用いて解説
  4. © LY Corporation 6 私の就活 学生の頃の就活スケジュール • サービス規模として一番大きく、自分も使っている • ML分野でもそれ以外でも優秀なエンジニアが多いイメージがあった

    • 選考でチームの先輩やリーダーと喋ってフィーリングが合った • 待遇 2019/4(修士1年生) 2020/1 2020/6 インターンなど 本選考 インターン • 2019/6 M3 (1ヶ月) • 2019/9 CyberAgent (1ヶ月) • 2019/10 富士フィルム (1ヶ月) • 2019/11 – 12 Sansan (2ヶ月) LINEのインターンは応募したが落ちた LINEの本選考は2019/12 – 2020/2 頃 2019/10 どうしてLINEに?
  5. © LY Corporation 7 所属チームの紹介 • 機械学習を使ったプロダクトの実適用がメインの仕事 • ML技術でサービスの課題を解決する •

    研究(論文執筆)よりは開発寄り • PM組織もしっかりしていて開発に集中できる • 技術 • Python, Go, Rust • PySpark, Hadoop, PyTorch, • Kubernetes, Docker, Airflow • モデル学習API • オンライン推薦API • 横断基盤Feature Vector サービス横断の共通ML基盤 • LINE NEWSの記事推薦 • LINEギフトの贈り物提案 • チャットで文字を打つとスタンプが 出てくる機能 サービス向けのMLソリューション
  6. © LY Corporation 8 LYのデータ組織で働く面白さ(1/2) • JPだけで1億、グローバルだともっとたくさん • 家族も友人もみんな使っている •

    これほどのユーザーデータをどう分析し、MLモデルを適用するのか • データが少ないことよりも多くて困ることの方が多い すごい数の ユーザーと トラフィック 様々な プロダクトに 横断的に関わる ことができる • 横断組織ならではのおもしろさ • 私が関わったサービスもたくさんある • LINE公式アカウント、LINEスタンプ、LINEバイト、 LINE NEWS、LINE MUSIC、etc. • 横展開を常に意識する必要がある
  7. © LY Corporation 9 LYのデータ組織で働く面白さ(2/2) • 無理ない範囲でアサインが行われる • 意外と仕事は柔軟で、少人数の新しいプロジェクトもある •

    望めば型にはまらない仕事もやらせてもらえる 適度に柔軟 適度に安定の バランス しっかりした待遇 良い労働環境 • 労働環境は恵まれていると感じる、基本的に不満点がない • チームメンバーは10 – 19時くらいで働く場合が多い • 残業をしなければならないことは基本的にない • 早退や有給も融通が効く
  8. © LY Corporation • 当初は枠ごとにバラバラのロジックが動いており、相当古いものもあった • ドメイン特化のルールも多く、特徴量や最適化対象の選定も簡単ではない • まず面ごとのモデルを集約して共通パイプラインを構築した •

    その後、面ごとに最適化したRankerを導入。2段階パイプラインで精度を改善した 11 プロジェクト紹介:LINE公式アカウント×推薦 • サービス横断のユーザー特徴 • ユーザーの行動履歴 • 公式アカウントの属性情報 共通化された 推薦候補 生成モデル 面ごとに個別最適化 されたモデル HomeTab OAList OA Profile Ranker Model Deep Two-Tower Model DB Users MLモデルの改善
  9. © LY Corporation • 1年でA/Bテストを6回実施! 粘り強く & 高速な改善サイクルを回した • 大幅な性能改善を達成!

    • 社内賞をもらった! • データ関連施策を表彰するData Award プロジェクト紹介:LINE公式アカウント×推薦 KPI(月間友だち追加数)の推移 改善の成果
  10. © LY Corporation 13 プロジェクト紹介:LINE公式アカウント×ML 取り組みのおもしろポイント • 自分の手でユーザーに届く改善ができる。A/B Testで試行錯誤できる •

    効果的な施策なら影響も非常に大きい • 関連してML適用できそうな施策を提案できる 他のチャレンジングなOA施策の例 配信最適化 不正OA対策 最近問題になっている 公式アカウントの 詐欺行為などを MLで解消する OAからの配信メッセージ 「いつ」「誰に」「何を」 送るのかをMLで最適化