Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Ikuya Murasato
February 18, 2022
Education
180
0
Share
ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜
2022/02/18(金)に開催したExploratory データサイエンス勉強会#22の滋賀医科歯科大学様のご登壇資料です。
Ikuya Murasato
February 18, 2022
More Decks by Ikuya Murasato
See All by Ikuya Murasato
トピックモデル分析を活用した問合せ業務の効率化
ikuyam
1
290
回帰分析の活用による新商品の販売力予測
ikuyam
1
190
生存分析モデルを利用したLineのブロック要因分析
ikuyam
0
130
自動車トラブルと気象条件などの探索的データ分析
ikuyam
0
120
データサイエンス「も」使えるチェンジメーカー輩出への挑戦
ikuyam
0
470
ExploratoryとRによる全学データサイエンス教育
ikuyam
0
700
エンゲージメント向上のための人事制度改革 - 管理部門におけるExploratoryの活用
ikuyam
0
2.1k
「学ぶ」分析技術から「使う」分析技術へ - Exploratoryによるドリル演習
ikuyam
0
510
データサイエンス入門教育の現場から - 46歳新任教員2年間の苦闘
ikuyam
0
620
Other Decks in Education
See All in Education
Pen-based Interaction - Lecture 4 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.2k
✅ レポート採点基準 / How Your Reports Are Assessed
yasslab
PRO
0
310
反応する前に「受容する」力を鍛える。 自分の安全地帯🌱 を育てよう / Cultivating and sharing ventral vagal safety.
spring_aki
0
120
Fulbright DAI 2025 學人經驗分享
joannie
0
720
Why the humanities may be your best career bet
figarospeech
0
150
SSH_handshake_easy_explain
kenbo
0
960
アントレプレナーシップ教育機構 概要
sciencetokyo
PRO
0
1.4k
Blueprint for Strengthening Community Colleges Training Grant Success
territorium
PRO
0
240
Analysis and Validation - Lecture 4 - Information Visualisation (4019538FNR)
signer
PRO
0
2.6k
地区危機管理委員会 出前セミナー「ロータリーにおける危機管理」:膳所 和彦 氏(国際ロータリー第2720地区 パストガバナー・日田ロータリークラブ・医療法人恒心会ぜぜ医院 理事長):2720 Japan O.K. ロータリーEクラブ2026年2月16日卓話
2720japanoke
1
620
SARA Annual Report 2025-26
sara2023
1
270
計算物理におけるGitの使い方 / 01-c-compphys
kaityo256
PRO
2
540
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Mind Mapping
helmedeiros
PRO
1
140
The Cult of Friendly URLs
andyhume
79
6.8k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.7k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
The agentic SEO stack - context over prompts
schlessera
0
730
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
96
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Transcript
Exploratory で データをExplore する 〜研究⼒の可視化を⽬指して〜 滋賀医科⼤学IR室 ⽯井真理⼦ 2022年2⽉18⽇(⾦)Exploratory勉強会 Exploratory 1
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 2
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 3
1.⾃⼰紹介 •2021年4⽉ ブートキャンプ •2021年5⽉ データラングリング・トレーニング •2019年10⽉以前 教育関連企業や私⽴⼤学で勤務 •2019年11⽉〜現在 滋賀医科⼤学IR室勤務 4
2.滋賀医科⼤学(SUMS)について① 滋賀県 京都府 ⼤阪府 兵庫県 国⽴⼤学法⼈滋賀医科⼤学 5
2.滋賀医科⼤学(SUMS)について② 出典︓滋賀医科⼤学統合報告書2021 IR室は2019年4⽉設置 6
2.滋賀医科⼤学(SUMS)について③ IR室ではどんなことをしているのか (IR : Institutional Research) l 学⻑の意思決定及び各種評価に係る情報の 収集並びに分析 l
⼤学経営及び⼈材育成に係る総合的な 戦略の企画⽴案における⽀援 滋賀医科⼤学IR室規定より 統合報告書 Integrated Report 7
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 8
3.⼤学の予算① 国立大学協会, 第4期中期目標期間における国立大学法人運営費交付金の在り方に関する検討会(第6回)資料1, 文部科学省, 2021-03-11 https://www.mext.go.jp/kaigisiryo/content/20210310-mxt_hojinka-000013351_2.pdf 運営交付⾦ 国からの予算は 減少傾向 9
3.⼤学の予算① 第4期中期⽬標期間における国⽴⼤学法⼈運営費交付⾦の在り⽅に関する検討会(第9回)参考資料2, ⽂部科学省, 2021-06-18 https://www.mext.go.jp/kaigisiryo/content/20210617-mxt_hojinka-000016042_5.pdf 運営交付⾦ 研究費が占める割合も 減少傾向 国⽴⼤学法⼈等(90法⼈)の経常費⽤の推移 外部資⾦の獲得が重要
10
3.⼤学の予算② 科学研究費助成事業 全ての分野にわたり「学術研究」 を発展させることを⽬的とする 「競争的研究費」 出典︓⽇本学術振興会 https://www.jsps.go.jp/j-grantsinaid/index.html(⼀部抜粋) 科学研究費助成事業(科研費) 採択率は全国平均を 上回っている
滋賀医科⼤学の現状 滋賀医⼤は安⼼していて⼤丈夫なのか︖ 11
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 12
4.⽬的と課題 さまざまな視点で科研費の採択率や申請率の 現状を把握するために集計・可視化を⾏う 13
4.⽬的と課題 申請率 採択率 若⼿研究者 年齢別 所属別 職種別 指標とカテゴリーに複数の組み合わせがある 指標 カテゴリー
業 務 上 の 課 題 14
4.⽬的と課題 データの整理・集計に時間を取られ、⼀歩進んだ集 計・可視化に時間が取れていない その結果、いつも⾒ている指標だけしか集計・可視 化できずに、異なる視点から科研費の採択率を⾒る ことができていない 組 織 と し
て の 課 題 エクセル集計の限界 15
4.⽬的と課題 まとめ l 様々な視点で採択率を⾒るためには、 データを結合したり、計算⽤の列を作ったり、 「データの加⼯」は必須 l データの加⼯が正しくできたのか、 「チェック」を⾏うことも必要 l
最終的に「集計・可視化」を⾏う これらの探索サイクルをまわす必要がある 16
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 17
5.データを探索するためのサイクル Exploratoryで探索サイクルをまわす データ加⼯ チェック 集計・可視化 Exploratory 18
5.データを探索するためのサイクル ・サマリビューを確認 ・重複を表⽰ ・N/Aのみ表⽰ ・集計表を作成 ・チャートで表⽰ 20 全教員の背景データ 採択リスト 申請リスト
データ加⼯ チェック 集計・可視化 採択 申請 ・マージ/Union ・結合/Join
5.データ探索サイクル 科研費の採択率をカテゴリー別で集計・可視化するためには、 2つのデータを結合する必要がある 左外部結合(Left Join) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001
〇〇 AA0002 △△ AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0002 TRUE 若⼿研究 AA0003 TRUE 挑戦的研究(萌芽) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0002 △△ TRUE 若⼿研究 AA0003 □□ TRUE 挑戦的研究(萌芽) 全教員の背景データ 採択リスト 21 データ加⼯
5.データ探索サイクル 22 データ加⼯
5.データ探索サイクル 追加された列にオレンジ⾊の線が付く 23 データ加⼯
5.データ探索サイクル 結合した結果、⽋損値<NA>になっていることがある 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001 〇〇 AA0002 △△
AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0003 TRUE 若⼿研究 AA0004 TRUE 挑戦的研究(萌芽) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0002 △△ <NA> <NA> AA0003 □□ TRUE 若⼿研究 AA0004 〇△ TRUE 挑戦的研究(萌芽) 全教員の背景データ 採択リスト 結合したデータ 24 チェック
5.データ探索サイクル サマリビューから⽋損値の有無を確認 25 チェック
5.データ探索サイクル 結合した結果、⾏が増えることもある 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001 〇〇 AA0002 △△
AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0001 TRUE 挑戦的研究(萌芽) AA0003 TRUE 若⼿研究 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0001 〇〇 TRUE 挑戦的研究(萌芽) AA0002 △△ <NA> <NA> AA0003 □□ TRUE 若⼿研究 全教員の背景データ 採択リスト 結合したデータ 26 チェック
5.データ探索サイクル 結合前 結合後 ステップを⾏き来することで結合前後の変化を確認できる 27 チェック
5.データ探索サイクル フィルタの「重複する⾏のみを残す」 確認が終わったステップは無効化 確認するためのステップを追加 28 チェック
5.データ探索サイクル 同⼀⼈物が複数の科研費に申請し、採択されていることがわかった 29 チェック
5.データ探索サイクル 簡単に集計表やグラフが作成できる 30 集計・可視化
5.データ探索サイクル ピンを移動して利⽤するデータを変えられる 31 集計・可視化
5.データ探索サイクル 「科研費採択」との相関をExploreする 32 集計・可視化
5.データ探索サイクル Y軸: 採択率 X軸:年齢 ※研究種目の「若手研究」は 他種目より採択率が高い ※科研費を申請した人でフィルタ 33 35歳ごろまでは採択率が⾼いことがわかる(右肩上がり) 集計・可視化
5.データ探索サイクル まとめ l データラングリングの時間を短縮できる l 異なった視点の分析・可視化が可能 l 探索が簡単にできて、再現性が⾼い 34
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 35
6.最後に Exploratoryで探索サイクルをまわし、データ加⼯・ チェックの⼿順を素早く⾏い、集計・可視化 Exploratory l 獲得⾦額や経年変化をみていく l ⼤学の今後に役⽴つデータを⾒つける 今後も探索を続けて 36
ご清聴ありがとうございました 滋賀医科⼤学IR室 ⽯井真理⼦ 2022年2⽉18⽇(⾦)Exploratory勉強会 Exploratory