Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-20231129
Search
Makito Oku
December 28, 2023
Research
0
180
oku-slide-20231129
クラリネットプロット: バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の表示法
奥 牧人 (富山大学)
2023/11/29
第76回 バイオ情報学研究会
Makito Oku
December 28, 2023
Tweet
Share
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20260209
okumakito
0
53
oku-slide-20240802
okumakito
0
200
oku-slide-20230827
okumakito
0
190
oku-slide-20230213
okumakito
0
290
oku-slide-20221212
okumakito
0
140
oku-slide-20221129
okumakito
0
190
oku-slide-20221115
okumakito
0
410
oku-slide-20220820
okumakito
0
440
oku-slide-stat1-1
okumakito
0
340
Other Decks in Research
See All in Research
データサイエンティストの業務変化
datascientistsociety
PRO
0
290
量子コンピュータの紹介
oqtopus
0
230
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
170
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
23k
AI Agentの精度改善に見るML開発との共通点 / commonalities in accuracy improvements in agentic era
shimacos
6
1.4k
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
390
20年前に50代だった人たちの今
hysmrk
0
170
AIを叩き台として、 「検証」から「共創」へと進化するリサーチ
mela_dayo
0
120
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
1
210
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
260
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
130
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
6
4.1k
Featured
See All Featured
New Earth Scene 8
popppiees
1
1.7k
Designing for humans not robots
tammielis
254
26k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
Typedesign – Prime Four
hannesfritz
42
3k
Evolving SEO for Evolving Search Engines
ryanjones
0
150
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
130
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
How to Ace a Technical Interview
jacobian
281
24k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
150
Transcript
クラリネットプロット: バイオリンプロットに代わる scRNA-seqデータの ゼロ過剰分布の表示法 奥 牧人 (富山大学) 2023/11/29 第76回 バイオ情報学研究会
1 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 2
/ 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 3
/ 27
はじめに 単一細胞RNAシーケンス (single cell RNA-sequencing) 略して scRNA-seq 試料中の各細胞に含まれるmRNAなどの転写産物の量を 次世代シーケンサーで網羅的に計測する手法 非常に多くの0の値を含む
ゼロ過剰 な分布を示す。 0の値の発生を ドロップアウト と呼ぶ。 4 / 27
バイオリンプロット scRNA-seqデータには バイオリンプロット がよく使われる。 しかし、0の割合が大きいと非ゼロの部分が潰れてしまう。 5 / 27
クラリネットプロット 本研究では クラリネットプロット を提案する。 0の割合と非ゼロの分布を同時に表すことが出来る。 6 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 7
/ 27
バイオリンプロット ヒストグラムと似ている。 ヒストグラムを滑らかにした ような カーネル密度推定 を使う。 これを複製して反転し、元の図に 加える。 縦向きにする。 元論文では内側に箱ひげ図を
入れていたが、scRNA-seqでは 入れないことも多い。 8 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 9
/ 27
クラリネットプロット データを大きさの順に並べて 棒グラフにする。 棒グラフの上端を結んで 折れ線グラフにする。 横軸を0から1までの 分位数 に 置き換える。 図を複製して反転し、元の図に
加える。 (必要に応じて) 縦向きにする。 10 / 27
分位関数 クラリネットプロットは 分位関数 に対応する。 確率密度関数を積分したものが累積分布関数 累積分布関数の逆関数が分位関数 11 / 27
名前について クラリネットプロットという名前は、バイオリンプロットとの 関係が分かりやすいよう、楽器の中から選んだ。 他にも幾つか考えたが、既に別の意味で使われていた。 つららプロット (Kruskal & Landwehr, 1983) 鍾乳石プロット
(Atkinson & Mulira, 1993) トランペットプロット (Corte, Liou & O'Reilly, 2023) 芋虫プロット (van Buuren & Fredriks, 2001) 12 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 13
/ 27
人工データへの適用例 1番を基準 2, 3番は平均を変更 4, 5番は分散を変更 6, 7番は歪度を変更 8番は二峰性 14
/ 27
実データへの適用例 GSE180139のデータ を使用 ランダムに10個 15 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 16
/ 27
描画スタイル A. 上下反転、B. 横向き、C. 末尾の直線を非表示、D. 縦軸を分位数 でなく順位に変更 17 / 27
描画スタイル、続き E. 半分、F. バイオリンプロットと半分ずつ、G. ヒートマップ、 H. 縞模様 18 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 19
/ 27
適さない例、その1 複雑な分布の形を調べるのには向いていない。 おそらく積分により高周波成分の信号が弱まるため 20 / 27
適さない例、その2 外れ値を含むデータにも適していない。 最大幅は最大値で決まるので、細くなってしまう。 21 / 27
適さない例、その3 負の値を含むデータにも必ずしも適さない。 例えば、3番のピーク付近が細く表示され、直観に反する。 22 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 23
/ 27
公開ツール クラリネットプロットを作図するPythonのコードは GitHubで公開済み https://github.com/okumakito/clarinet_plot Google Colabのノートブックで開けるようにしてある。 24 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 25
/ 27
まとめと考察 まとめ バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の 表示法として、クラリネットプロットを提案した。 0の割合と非ゼロの分布を同時にうまく表せる。 一部の細胞のみで高発現する遺伝子のデータ分布を見るには、 バイオリンプロットより適していると考えられる。 考察 普及するかどうかはSeurat (スーラ)
次第 少なくとも私は同期性揺らぎ遺伝子の 研究で今後使う予定 26 / 27
ご清聴どうもありがとうございました! 27 / 27