Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜
Search
Ikuya Murasato
February 18, 2022
Education
0
140
ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜
2022/02/18(金)に開催したExploratory データサイエンス勉強会#22の滋賀医科歯科大学様のご登壇資料です。
Ikuya Murasato
February 18, 2022
Tweet
Share
More Decks by Ikuya Murasato
See All by Ikuya Murasato
トピックモデル分析を活用した問合せ業務の効率化
ikuyam
1
200
回帰分析の活用による新商品の販売力予測
ikuyam
0
140
生存分析モデルを利用したLineのブロック要因分析
ikuyam
0
90
自動車トラブルと気象条件などの探索的データ分析
ikuyam
0
61
データサイエンス「も」使えるチェンジメーカー輩出への挑戦
ikuyam
0
340
ExploratoryとRによる全学データサイエンス教育
ikuyam
0
460
エンゲージメント向上のための人事制度改革 - 管理部門におけるExploratoryの活用
ikuyam
0
1.5k
「学ぶ」分析技術から「使う」分析技術へ - Exploratoryによるドリル演習
ikuyam
0
340
データサイエンス入門教育の現場から - 46歳新任教員2年間の苦闘
ikuyam
0
430
Other Decks in Education
See All in Education
1113
cbtlibrary
0
270
Use Cases and Course Review - Lecture 8 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
790
2409_CompanyInfo_Hanji_published.pdf
yosukemurata
0
640
Image Processing 1 : 1.Introduction
hachama
0
440
AWS All Certが伝える 新AWS認定試験取得のコツ (Machine Learning Engineer - Associate)
nnydtmg
1
700
HCI Research Methods - Lecture 7 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
750
TP5_-_UV.pdf
bernhardsvt
0
120
Evaluation Methods - Lecture 6 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
740
Ch2_-_Partie_1.pdf
bernhardsvt
0
120
XML and Related Technologies - Lecture 7 - Web Technologies (1019888BNR)
signer
PRO
0
2.5k
Ch2_-_Partie_2.pdf
bernhardsvt
0
110
SQL初級中級_トレーニング【株式会社ニジボックス】
nbkouhou
0
23k
Featured
See All Featured
A Philosophy of Restraint
colly
203
16k
Making the Leap to Tech Lead
cromwellryan
133
9k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Measuring & Analyzing Core Web Vitals
bluesmoon
4
170
Producing Creativity
orderedlist
PRO
341
39k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
520
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
A better future with KSS
kneath
238
17k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Writing Fast Ruby
sferik
628
61k
Gamification - CAS2011
davidbonilla
80
5.1k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Transcript
Exploratory で データをExplore する 〜研究⼒の可視化を⽬指して〜 滋賀医科⼤学IR室 ⽯井真理⼦ 2022年2⽉18⽇(⾦)Exploratory勉強会 Exploratory 1
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 2
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 3
1.⾃⼰紹介 •2021年4⽉ ブートキャンプ •2021年5⽉ データラングリング・トレーニング •2019年10⽉以前 教育関連企業や私⽴⼤学で勤務 •2019年11⽉〜現在 滋賀医科⼤学IR室勤務 4
2.滋賀医科⼤学(SUMS)について① 滋賀県 京都府 ⼤阪府 兵庫県 国⽴⼤学法⼈滋賀医科⼤学 5
2.滋賀医科⼤学(SUMS)について② 出典︓滋賀医科⼤学統合報告書2021 IR室は2019年4⽉設置 6
2.滋賀医科⼤学(SUMS)について③ IR室ではどんなことをしているのか (IR : Institutional Research) l 学⻑の意思決定及び各種評価に係る情報の 収集並びに分析 l
⼤学経営及び⼈材育成に係る総合的な 戦略の企画⽴案における⽀援 滋賀医科⼤学IR室規定より 統合報告書 Integrated Report 7
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 8
3.⼤学の予算① 国立大学協会, 第4期中期目標期間における国立大学法人運営費交付金の在り方に関する検討会(第6回)資料1, 文部科学省, 2021-03-11 https://www.mext.go.jp/kaigisiryo/content/20210310-mxt_hojinka-000013351_2.pdf 運営交付⾦ 国からの予算は 減少傾向 9
3.⼤学の予算① 第4期中期⽬標期間における国⽴⼤学法⼈運営費交付⾦の在り⽅に関する検討会(第9回)参考資料2, ⽂部科学省, 2021-06-18 https://www.mext.go.jp/kaigisiryo/content/20210617-mxt_hojinka-000016042_5.pdf 運営交付⾦ 研究費が占める割合も 減少傾向 国⽴⼤学法⼈等(90法⼈)の経常費⽤の推移 外部資⾦の獲得が重要
10
3.⼤学の予算② 科学研究費助成事業 全ての分野にわたり「学術研究」 を発展させることを⽬的とする 「競争的研究費」 出典︓⽇本学術振興会 https://www.jsps.go.jp/j-grantsinaid/index.html(⼀部抜粋) 科学研究費助成事業(科研費) 採択率は全国平均を 上回っている
滋賀医科⼤学の現状 滋賀医⼤は安⼼していて⼤丈夫なのか︖ 11
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 12
4.⽬的と課題 さまざまな視点で科研費の採択率や申請率の 現状を把握するために集計・可視化を⾏う 13
4.⽬的と課題 申請率 採択率 若⼿研究者 年齢別 所属別 職種別 指標とカテゴリーに複数の組み合わせがある 指標 カテゴリー
業 務 上 の 課 題 14
4.⽬的と課題 データの整理・集計に時間を取られ、⼀歩進んだ集 計・可視化に時間が取れていない その結果、いつも⾒ている指標だけしか集計・可視 化できずに、異なる視点から科研費の採択率を⾒る ことができていない 組 織 と し
て の 課 題 エクセル集計の限界 15
4.⽬的と課題 まとめ l 様々な視点で採択率を⾒るためには、 データを結合したり、計算⽤の列を作ったり、 「データの加⼯」は必須 l データの加⼯が正しくできたのか、 「チェック」を⾏うことも必要 l
最終的に「集計・可視化」を⾏う これらの探索サイクルをまわす必要がある 16
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 17
5.データを探索するためのサイクル Exploratoryで探索サイクルをまわす データ加⼯ チェック 集計・可視化 Exploratory 18
5.データを探索するためのサイクル ・サマリビューを確認 ・重複を表⽰ ・N/Aのみ表⽰ ・集計表を作成 ・チャートで表⽰ 20 全教員の背景データ 採択リスト 申請リスト
データ加⼯ チェック 集計・可視化 採択 申請 ・マージ/Union ・結合/Join
5.データ探索サイクル 科研費の採択率をカテゴリー別で集計・可視化するためには、 2つのデータを結合する必要がある 左外部結合(Left Join) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001
〇〇 AA0002 △△ AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0002 TRUE 若⼿研究 AA0003 TRUE 挑戦的研究(萌芽) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0002 △△ TRUE 若⼿研究 AA0003 □□ TRUE 挑戦的研究(萌芽) 全教員の背景データ 採択リスト 21 データ加⼯
5.データ探索サイクル 22 データ加⼯
5.データ探索サイクル 追加された列にオレンジ⾊の線が付く 23 データ加⼯
5.データ探索サイクル 結合した結果、⽋損値<NA>になっていることがある 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001 〇〇 AA0002 △△
AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0003 TRUE 若⼿研究 AA0004 TRUE 挑戦的研究(萌芽) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0002 △△ <NA> <NA> AA0003 □□ TRUE 若⼿研究 AA0004 〇△ TRUE 挑戦的研究(萌芽) 全教員の背景データ 採択リスト 結合したデータ 24 チェック
5.データ探索サイクル サマリビューから⽋損値の有無を確認 25 チェック
5.データ探索サイクル 結合した結果、⾏が増えることもある 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001 〇〇 AA0002 △△
AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0001 TRUE 挑戦的研究(萌芽) AA0003 TRUE 若⼿研究 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0001 〇〇 TRUE 挑戦的研究(萌芽) AA0002 △△ <NA> <NA> AA0003 □□ TRUE 若⼿研究 全教員の背景データ 採択リスト 結合したデータ 26 チェック
5.データ探索サイクル 結合前 結合後 ステップを⾏き来することで結合前後の変化を確認できる 27 チェック
5.データ探索サイクル フィルタの「重複する⾏のみを残す」 確認が終わったステップは無効化 確認するためのステップを追加 28 チェック
5.データ探索サイクル 同⼀⼈物が複数の科研費に申請し、採択されていることがわかった 29 チェック
5.データ探索サイクル 簡単に集計表やグラフが作成できる 30 集計・可視化
5.データ探索サイクル ピンを移動して利⽤するデータを変えられる 31 集計・可視化
5.データ探索サイクル 「科研費採択」との相関をExploreする 32 集計・可視化
5.データ探索サイクル Y軸: 採択率 X軸:年齢 ※研究種目の「若手研究」は 他種目より採択率が高い ※科研費を申請した人でフィルタ 33 35歳ごろまでは採択率が⾼いことがわかる(右肩上がり) 集計・可視化
5.データ探索サイクル まとめ l データラングリングの時間を短縮できる l 異なった視点の分析・可視化が可能 l 探索が簡単にできて、再現性が⾼い 34
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 35
6.最後に Exploratoryで探索サイクルをまわし、データ加⼯・ チェックの⼿順を素早く⾏い、集計・可視化 Exploratory l 獲得⾦額や経年変化をみていく l ⼤学の今後に役⽴つデータを⾒つける 今後も探索を続けて 36
ご清聴ありがとうございました 滋賀医科⼤学IR室 ⽯井真理⼦ 2022年2⽉18⽇(⾦)Exploratory勉強会 Exploratory