Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
良書紹介04_生命科学の実験デザイン
Search
ぶんちん
September 04, 2025
Science
0
140
良書紹介04_生命科学の実験デザイン
ぶんちん
September 04, 2025
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
良書紹介05_データ分析実務スキル検定 公式テキスト
bunnchinn3
0
21
“異常”検知プロジェクトの難しさ
bunnchinn3
0
21
LTのはじめかた(VRChat技術系界隈を想定)
bunnchinn3
0
72
“成果”を出すためのプレゼン準備 プレゼン資料作成の前にやること
bunnchinn3
1
220
良書紹介03_ データ分析読解の技術
bunnchinn3
0
76
MVP未満からの成果獲得
bunnchinn3
0
81
個人計画とプロジェクト遂行の考え方
bunnchinn3
0
100
データ分析イベントデータ説明(VRChatイベントカレンダー)
bunnchinn3
0
130
<事前告知> DS集会データ分析イベント VRChatイベントカレンダー
bunnchinn3
0
100
Other Decks in Science
See All in Science
「遂行理論の未来」(松島斉教授最終講義記念セッションの発表資料)
shunyanoda
0
730
MCMCのR-hatは分散分析である
moricup
0
610
あなたに水耕栽培を愛していないとは言わせない
mutsumix
1
280
2025-06-11-ai_belgium
sofievl
1
240
Kaggle: NeurIPS - Open Polymer Prediction 2025 コンペ 反省会
calpis10000
0
420
次代のデータサイエンティストへ~スキルチェックリスト、タスクリスト更新~
datascientistsociety
PRO
3
31k
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2.1k
フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計 / Controller Design for Augmented Systems with Symbolic Inputs and Outputs Using Feedforward Neural Network
konakalab
0
110
Agent開発フレームワークのOverviewとW&B Weaveとのインテグレーション
siyoo
0
430
(2025) Balade en cyclotomie
mansuy
0
480
データマイニング - グラフデータと経路
trycycle
PRO
1
310
学術講演会中央大学学員会府中支部
tagtag
PRO
0
360
Featured
See All Featured
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
140
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.4k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
480
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
190
Making Projects Easy
brettharned
120
6.6k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
290
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
260
The Pragmatic Product Professional
lauravandoore
37
7.2k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Transcript
DS初心者向け 知名度は低いけどオススメの良書紹介4 ~効果的な現実世界のデータ収集~ ぶんちん 2025年9月4日 データサイエンティスト集会 in VRC 1
自己紹介 ぶんちん データサイエンティスト集会の主催 複合経営が特徴の企業(製造業)に所属 データ分析担当者だったが。。。 e ラ
ー ニ ン グ の イ ラ ス ト ( 男 性 ) 困 っ た 顔 で 働 く 会 社 員 の イ ラ ス ト ( 男 性 ) 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやってもらったら、 成果が増えるのでは? 特に非専門家向けの データサイエンス活用教育 2
良い書籍はたくさんあるけど。。。 良書は人気になりやすい 3 人気書籍 知られていない本でも良書がある 今回はそれを紹介
データ収集のデザイン Garbage in, garbage out ⇒『無意味なデータ(ゴミ)』を入力する 『無意味な結果(ゴミ)』が出力される ゴミにならないよう設計していますか? 特に現実世界のデータ取得! 4
丸投げNG
現実世界のデータ取得の難しさ 全てのデータに明確な意図を持った設計が必要 ⇒ 逆に意図しないデータは取得できない どのようなデータを取りたいのか どのように測定するのか どのような条件で記録するのか
どのくらいの期間・量のデータを記録するのか 5 データ取得は高コスト(カネ・時間・手間) ⇒ 追加・変更が困難 なんとなくで条件を決めるのは不適切
データ取得条件を検討する分野はないのか 実験の設計! 6 実験 =未知を明らかにするための 科学的アプローチ方法
生命科学の実験デザイン 「生命科学」とのタイトルだが、分野に関わ らず有用な内容 「実験デザイン」を扱った和書は本書を含め て2冊しか見つからず、どちらもバイオ系 成果を出すための実験(データ取得条件)の 設計に必要な要件を知ることができる
7
目次 1. デザインはなぜ大切か 2. 仮説を明確にする 3. デザインの大枠を選ぶ 4. 個体間のばらつき、反復、サンプリング 5.
偽反復 6. サンプルサイズ、検出力、効果的なデザイン 7. 最もシンプルな実験デザイン―1因子完全ランダム化デザイン 8. 複数の因子をもつ実験―複因子デザイン 9. 完全ランダム化を超えて―ブロックと共変数 10.被験体内デザイン 11.測定―良質なデータをとるために 8 ここにコンセプトが集約 コンセプト ⇒ 具体的対応
誤った思い込み どのようにデータをとるかは重要ではない.統計的 な「応急処置」は必ずあるので,どのようにとった データでも解析はできる. とにかくデータをたくさんとりさえすれば,何かし らおもしろい結果が出てくるし,非常に微妙な効果 でさえも検出できる. 9 現実はそんなに甘くない!
大学(アカデミック)の出版社だけど キレッキレな表現 1.2 貧弱なデザインの害悪 1.2 .1 時間と金の無駄遣い
劣悪な実験デザインで時とエネルギーを無駄遣いするのが愚 かであることは言うまでもない. 10 地に足の着いた話が多く、表現もわかりやすい ⇒基礎統計と並行して学ぶべき本では?
なんで知名度が低い領域なの? 建前:本書の内容は大学での研究(卒論・修論・博 士論文)に取り組む中で、全員が身に着けている 11 本当? • 体系化されて説明されている書籍が少ないのに? • 実験しない人も学んでいる? •
仕事でこの考え方、使えている?
実験デザインの重要性 できているようで、実はできていない領域 課題オーナーに丸投げはNG 成果を出すためには、押さえておく分野 個人的にビジネスでも有用だと思う 12
データ取得のコア部分に 積極的に関与しませんか?