Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DSC Planning for 2023 summer Internship

LINE
April 21, 2023

DSC Planning for 2023 summer Internship

2023年インターンシップ 機械学習・AIコースの機械学習コースに関する説明資料です。

機械学習コースのProgram Managerとしてインターンシップに参加いただく場合に配属可能性のある組織を紹介しています。

LINE

April 21, 2023
Tweet

More Decks by LINE

Other Decks in Technology

Transcript

  1. ొஃऀ঺հ ڥ ඒथ %BUB4DJFODF$FOUFS %4$1MBOOJOH5FBN • 職歴系 • 通信会社研究所出⾝ •

    Research 1くらい、Development 9 くらいしてた。 • 事業会社でWebサービス企画・運⽤経験あり。 • Manager歴は8年くらい。 • 広く浅くのため専⾨性低め。 • 脈略がない:SemanticWeb -> QueueSystem開発 -> bigTable模倣開発 -> 仮想マシン管理システム開発 -> ⼤規模トランザクションシステム開発 -> Web Service Direction -> 対話システムエンジン開発PM -> AutoMLSytemPM+R&D management -> 現職 • 現職 • ML/DS関連ProjectのPjM/PdM • Online Recommendation Product • LINE Service’s ML Product etc. • 上記組織のManager • Private • 登⼭、バンド、写真、ランニングが好き。 • ⼦供3⼈の⺟親業もしてる。 • 最近は再度⼤学編⼊し4年⽣。(ART)
  2. .-૊৫Ͱ͸༷ʑͳϥΠϒϥϦɾιϦϡʔγϣϯΛ։ൃ 3FDPNNFOEBUJPO &YTUJDLFST 4UJDLFS"VUP5BHHJOH • スタンプ画像から 意味的なタグを推測し、⾃動付与 • 2021年〜、深層学習モデルを更新(Efficient Net)

    6TFS1FSTPOB1SFEJDUJPO • サービス横断のユーザ⾏動ログを利⽤して、DNN系のロジックで推定(〜数億ユーザ) • 継続的にリファクタリングやロジック改善等を進めており、MLP Mixerなども利⽤ LINE for Business 2022年10-2023年3⽉期 媒体資料より https://www.linebiz.com/jp/download/ 出前館 %SJWFS .FSDIBOU 6TFS  3FR GPSPSEFS  3FRGPS EFMJWFSZ  3FRGPS QSFQBSBUJPO  QJDLVQ EFMJWFSZ 複数の機械学習のコンポーネントを提供し、オンラ イン予測のためのパイプラインも個別に構築 For Users • 商品の推薦(≒ 何を注⽂すればよいか︖) For Demae-can (as a broker/仲介者) • オーダーの配達依頼(≒ 誰に配達を依頼すればよいか?) For Drivers • エリア単位での直近需要の予測(≒ どこで待てばよいか?) • レストランの準備時間予測(≒ いつ受け取りに⾏けばよい か?) 4NBSU$IBOOFM トークリスト上部にコンテンツ・広告を表⽰ • 2段構成で、ML室は下記の両⽅を提供 1. 個別サービスのコンテンツ向けターゲティングロジック (様々な組織が供給) 2. 最終的にコンテンツ or 広告を1つ選定 -JCSB4VJUF MLの開発効率化 + DSの検証効率化のための内製ツール 画⾯設計・デザインをUIのチームに依頼し、バックエンドをML室で開発 CMS for A/B Test & Rollout Dashboard for A/B Test 推薦結果の可視化 $SPTT4FSWJDF6TFS$POUFOU'FBUVSFT • 事業横断でML向けのデータを整備し、社内の他ML組織に提供 • 表現学習により、密ベクトル化したデータなども作成 .-#BUDI"1*T MLプラットフォーム化により、開発したモデルの再利⽤性や開発効率などを⼤幅に向上 0XO-JCTGPS%FW&GGJDJFODZ • cumin: データアクセスの抽象化 • swimmy: RPC to k8s cluster • ghee: 分散並列処理(転送 & 演算) • ghee-models: MLモデル(python) • masala: MLモデル(yaml) ※ 別途説明あります
  3. %4૊৫Ͱ͸୲౰ϓϩμΫτٴͼɺ -*/&ϓϥοτϑΥʔϜશମ΁ͷߩݙΛ໨ࢦ͢  データ分析によって各-*/&サービスの競争⼒を最⼤化す る • データを活⽤した継続的改善の仕組みづくり • 重要かつ難易度の⾼い課題の解決 

    -*/&全体のデータ活⽤レベルを向上させる • 全ての-*/&3のデータ活⽤レベルの底上げ引き上げ • 広く適⽤可能なデータ分析の仕組み プラットフォーム、プロセ ス、⽅法論、 FUD の提供 ※ 別途説明あります
  4. .-%41MBOOJOH5FBNr 1SPHSBN.BOBHFSͱ͸ʁ R&R .-΍%4ͷྗͰ-*/&αʔϏεՁ஋޲্ʹ޲͚ͨ1SPKFDUͷਪਐΛߦ͏ 1SPKFDUͷϑΣʔζʹΑͬͯSPMF͕ҟͳΔ͜ͱ͕ಛ ௃ 1SPEVDU.BOBHFNFOU • .-%4ؔ࿈ͷԣஅతͳ1SPEVDUͷϩʔυϚοϓઃܭɺΰʔϧڞ༗ͳͲ 1SPHSBN.BOBHFNFOU

     .- • αʔϏεଆʹ.- 1SPEVDUΛ׆༻ͨ͠Ձ஋޲্ࢪࡦΛఏҊ͠ɺಋೖʹ޲͚ͨλεΫઃܭͱਐ௙؅ཧɺಋೖޙͷӡ༻؅ཧ • .-ൃ1SPEVDUͷ։ൃ؅ཧɺ׬੒ޙͷӡ༻؅ཧ 1SPHSBN.BOBHFNFOU %4 • ෼ੳґཔʹج͖ͮαʔϏεଆͷཁ๬ΛώΞϦϯά͠%BUB4DJFOUJTUͷλεΫઃܭͱਐ௙؅ཧ • %BUB4DJFOUJTUͱڞʹαʔϏε෼ੳΛߦ͍ͭͭɺࣄۀଆʹํ޲ੑ΍৽نࢪࡦఏҊͷਪਐ Members ɾ$34 ɾ"VUPSFDP ɾ/FXT ɾ4NBSU$IBOOFM ɾ %BUB.BOBHFNFOU ɾ-JCSB ɾ#BUDI"1* ɾ*OGSB ɾ%FW1SPDFT ɾ4IPQ TUJDLFSUIFNF ɾ%FNBFDBO ɾ1FSTPOB ɾ'FBUVSF7FDUPS ɾ-*/&Ϊϑτ ɾ-*/&1BZ ɾ-*/&όΠτ ɾ3% ɾ-*/&0GGJDJBM"DDPVOU ※他にも担当している案件は多数 ɾτʔΫ ɾ-*/&Ϊϑτ
  5. ͻͱ͜ͱͰ͍͏ͱʁ 不確実性が⾼くふんわりした案件のゴールを定めて、 MLエンジニアやデータサイエンティストとともにゴールを⽬指すお仕事。 ֓ཁ ΤϯδχΞྗ Ϗδωεྗ αΠΤϯεྗ ר͖ࠐΈྗ .- .-γεςϜΛ࡞͍ͬͯ͘1.

    ˕ ˛ ˛ ˕ %4 %BUB4DJFODF "OBMZTJTͷྗͰ ϏδωεΛਪਐͯ͘͠1. ˓ ˕ ˛ ˕ .-.-QSPEVDUʹඥͮ͘ .-FOHJOFFS .-1. ML Product Service Product ML Product Service Product ML Product Service Product 4FSWJDFFOHJOFFS 4FSWJDF1. ・・・ %4ࣄۀ 4FSWJDF ʹඥͮ͘ %4 %41. Service 4FSWJDFFOHJOFFS 4FSWJDF1MBOOFS 4FSWJDF.BSLFUFS MLとDSでは PM⼒に違い がある 開発 コンサル
  6. ։ൃαΠΫϧͱ1.ͷؔΘΓํ 1SPEVDUEJTDPWFSZ • ϓϩμΫτ՝୊ɾ໨ඪͷώΞϦϯάɾڞ༗ • .-׆༻ͷ࣮ݱՄೳੑͱՁ஋ʹ͍ͭͯݕ౼ %BUBJOHFTUVOEFSTUBOEJOH • ඞཁͳσʔλͷ࿈ܞਪਐ &YQFSJNFOU%FWFMPQNFOU

    • ࣮ݱՄೳੑͱՁ஋ʹ͍ͭͯ֬ೝɾ࠶ఆٛ "#ςετ • اըɾઃܭɾ࣮ࢪɾධՁ .POJUPSJOH • ධՁɾϑΟʔυόοΫ • ֤ϓϩηεΛԁ׈ʹϚωδϝϯτ͠ɺϓϩμΫτϦϦʔεʹ͍࣋ͬͯ͘ • Ձ஋ͷ͋ΔϓϩμΫτΛఏڙ͢Δ • ୭Ͱ΋ɺޮ཰త͔ͭ҆ఆతʹ։ൃɾӡ༻Ͱ͖Δঢ়ଶʹ͢Δ ཁ͸ɺ࣮૷Ҏ֎ͷશͯΛ୲౰
  7. ελϯϓ(auto suggest) 1SPEVDUEJTDPWFSZ • ΩʔϘʔυೖྗʹ͓͚ΔϢʔβ՝୊ͷղফ • Ծઆݕূํ๏Λݕ౼ %BUBJOHFTUVOEFSTUBOEJOH • ՝୊ղܾɾԾઆݕূʹඞཁͳσʔλ֬ೝ

    • σʔλ׆༻ʹؔ͢Δ՝୊ղܾ &YQFSJNFOU%FWFMPQNFOU • ΦϑϥΠϯݕূɾ࣮૷ͷؾ͖͔ͮΒԾઆΛڧԽ • γεςϜؒͷσʔλ࿈ܞɾग़ྗ "#テスト • Ծઆݕূ .POJUPSJOH • Ϣʔβͷ՝୊͕ղܾͰ͖͍ͯΔͷ͔Λݟଓ͚Δ
  8. 1FSTPOB ଐੑਪఆ 1SPEVDUEJTDPWFSZ • どんな属性を推定したいかを広告チームなどと相談 • 属性の定義をすり合わせ • (開発後)プロダクトの広報活動 %BUBJOHFTUVOEFSTUBOEJOH

    • インサイトリサーチチームとアンケート設計 • データ管理、権限管理についてすり合わせ &YQFSJNFOU%FWFMPQNFOU • 学習データの精度、予測分布の確認 • 結果によっては属性の定義⾒直し • 書き出し先の検討、各種システムとのつなぎ合わせ "#テスト • ޿ࠂจ຺ͰͷΦϑϥΠϯɺΦϯϥΠϯςετ • ݁Ռͷղऍ .POJUPSJOH • ֶशਫ਼౓ɺ༧ଌ෼෍ͷϞχλϦϯά • ༧ظ͠ͳ͍Τϥʔͷ௨஌ͱͦͷ࣌ͷࣗಈରԠ
  9. Ҋ݅ྫ,1*ϩδοΫπϦʔ ֓ཁ ɾαʔϏεάϩʔεΛاըͨ͠νʔϜͷൃ଍ ɾݱঢ়֬ೝ ߈Ίॴͷ೺Ѳ ɺ,1*ࡦఆͷͨΊʹϩδοΫπϦʔͷ࡞੒ΛఏҊ ɾࣄۀ෦ͱώΞϦϯάΛߦ͍,1*ࡦఆ ɾϢʔβηάϝϯτͷ੾Γํ͸%4ͷݕূ݁Ռʹج͖ܾͮఆ ٳ຾ɺҭ੒தͷఆٛ ɾϩδοΫπϦʔΛ༻͍ͨࢪࡦධՁํ๏ͷཱ֬

    ɾؔ࿈࿩୊Ͱɺ/4.ͷࡦఆʹ΋ൃల 1.ͷؔΘΓ͸ʁ ɾखΛಈ͔͢ͱ͜ΖҎ֎ͷશͯʹؔΘΔ ɾࣄۀ෦ͱͷNUH ɾ,1*ͷࡦఆ ෼ੳ؍఺Ͱͷҙݟग़͠΋͋Δ ɾ%4ϝϯόʔͷΞαΠϯͱܦաͷนଧͪ ɾ޿ใ׆ಈ Α͘ݟΔͱπϦʔͷΑ͏ͳܗΛͨ͠5BCMFBV