Upgrade to Pro — share decks privately, control downloads, hide ads and more …

IBMの若手有志データサイエンスコミュニティdsn

knst
November 26, 2019

 IBMの若手有志データサイエンスコミュニティdsn

・若手データサイエンティストを中心としたコミュニティdsnの紹介資料です。
・白金鉱業( Meetup vol.12)用に投稿した資料ですが、元ネタは若手社員を想定した資料ですので、ご参考までにご覧ください。
・20191125時点での情報で、資料内容については社内で承認を得ていますが、不適切な表現・記載があればご指摘ください。

リンク:
・IBM公式ブログからの特集記事 https://www.ibm.com/blogs/solutions/jp-ja/datascience_and_ai_dsn/
・白金鉱業イベントページ https://brainpad-meetup.connpass.com/event/147202/

knst

November 26, 2019
Tweet

More Decks by knst

Other Decks in Technology

Transcript

  1. 2019年度dsnをリードしてる若⼿社員 ©dsn, CbD, GBS, IBM, 2019 1 @knst_mshr • Masaharu

    Kinoshita • 新卒DS2年⽬ • 最近は構想策定だとか新規事業系の案件に⼊るビジネス寄りのDS • コーヒーは浅煎り派、ペットは猫派、⾔語はPython派 基 本 情 報 • 「じゃあ⽊下くんよろしく」と同期に⾔われ、なんとなくdsnをリード • それから1年弱頑張ったら、slackメンバー倍増、参加率15-20point upした • 結果的にdsnを⼝実にして社内外の⾊々な⽅々と繋がりが持てたことは収穫 • 個⼈も1期に1回はdsnでLT dsn
  2. “XX” で ”XX”とChannel検索 “経験から学ぶ” dsnは、データサイエンスに関するナレッジシェアの場を提供し、継続的な成⻑を促進 ©dsn, CbD, GBS, IBMJ, 2019

    2 活動 ⽬的 活動 概要 ”データサイエンス”に関する知識・スキルを⼊社2年⽬までの若⼿DSを中⼼にLTを通じて獲得 “経験から学ぶ”をコンセプトに、他者・⾃者の経験をシェアし、継続的な知識・スキル定着を促進 データサイエンス領域は秒針分歩で、相互にナレッジを共有して情報感度を⾼く保つことが重要 コミュニティ名 dsn (data science network) コンタクト 他⼈の”経験から学ぶ”︓「知らない」から「知っている」へ ⾃分の”経験から学ぶ”︓「知っている」から「使える」へ コミュニティで 学ぶ意義 適度に強制⼒のある状況で⾃⾝のテーマをOutput 現場 dsn 独学 テーマの ⾃由度 Output 確率 個⼈にとっての 学習効果 普段触れない情報をInput Internal slack
  3. 発表者は、Data Scientist (DS) に求められる⼀連のプロセスを”経験”し、DSのスキル定着を図る ©dsn, CbD, GBS, IBMJ, 2019 3

    テーマ・課題設定 データ収集・分析 ドキュメンテーション 発表/聴講 形式 テーマ 発表者 データサイエンス、データ分析に関連すれば可 LT(Lightning Talk)形式がメイン 各回2-4枠 *チームによる発表も可 活動頻度 全体勉強会は⽉1回 ディスカッション 分析設計 コミュニティルール︓個⼈のテーマには⾃由を、組織の運営には規則を テーマ選定によっては現場で経験し難い 0に近い状態からの⾃⾛ が求められる。”発表は⼈のためにならず”
  4. Tech. = Task x Alg. x Data x Tool 聴講者は、様々なタスク・アルゴリズム・データ・ツール等に関するナレッジを他者の”経験

    “から知る ©dsn, CbD, GBS, IBMJ, 2019 4 Slackを中⼼に⽇々の情報をシェアしている。全体活動に加え、業務内外のDS関連情報がシェアされる。 業務内 Tech 業務外 Biz *分析Alg.への⾔及があるLT 頻度 How What DL事故検知 アルゴリズム紹介 新規ビジネス プロダクト相談 コンペ⼊賞事例 論⽂紹介 分析PJの進め⽅ On-Siteによる情報収集 過去LT実績は「業務内・外」、「Tech*・Biz」と多岐に渡り、特にTech領域の知識を得る。「何をどう解くのか」をInputする。 On-Lineによる情報収集 LT分布イメージ Tech象限にあるLTの構成要素 何 (What) をどう (How) 解くかにおいて多彩。
  5. ご参考︓2019年度LTテーマ⼀部抜粋 ©dsn, CbD, GBS, IBM, 2019 6 • 競艇予想botを作ってみた話と 趣味分析のすすめ

    • 深層学習モデルによる事故検知アルゴリズム • Kaggle Silver Medal備忘録 • 機械学習とポートフォリオの意思決定 • 技術理事が語るIBMでデータサイエンティストとして働く意味 • LSTM&Optimizerの理論とCNNの時系列問題に対するアプローチ • GANsの基礎原理とGANのビジネス利⽤への考察 • CNNの基礎原理と画像処理案件 w/CNNの紹介 • ネットワークサイエンスにおける外れ値検出の⼿法 〜Financial Crimeへの応⽤を添えて〜 • RのYUIMAパッケージによる確率微分⽅程式のシミュレーション • 私のキャリアパスについて • Yield Management • NNの機械翻訳 • 2年⽬のお悩み相談︓分析PJってどうやって進めればいいの︖ • オブジェクト指向プログラミングとデータ分析 • 仮説検定に関する誤解 • グラフ構造データに対する畳み込みの定義について実データを使いな がら噛み砕く • 社会⼈DSとして4年⽬になって、やりたくもないチームリードをやってみ たんだが、これ結構⼤事じゃねとか思い始めた件 • 推薦システム • 実務で役⽴つKaggle Tips • めでたい潜在空間 • 社外でやってる介護事業拡⼤とアナリティクスアプローチの紹介 • データ同化
  6. ご参考︓最近は、dsnの活動を社外向けに“⾒える化”してます ©dsn, CbD, GBS, IBM, 2019 7 IBMの公式ブログの記事 ⽩⾦鉱業 Meetup

    Vol.12(⽩⾦鉱業 x IBM社内勉強会dsn 合同企画回) 公式ブログ記事︓https://cutt.ly/zeBOo98 ⽩⾦鉱業イベントページ︓https://cutt.ly/ceBOpYP