Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
主成分分析に基づく教師なし特徴抽出法を用いたコラーゲン-グリコサミノグリカンメッシュの遺伝子発...
Search
Y-h. Taguchi
October 19, 2025
Science
0
39
主成分分析に基づく教師なし特徴抽出法を用いたコラーゲン-グリコサミノグリカンメッシュの遺伝子発現への影響
第83回バイオ情報学研究会
https://www.ipsj.or.jp/kenkyukai/event/bio83.html
2025年10月23日
Y-h. Taguchi
October 19, 2025
Tweet
Share
More Decks by Y-h. Taguchi
See All by Y-h. Taguchi
中央大学AI・データサイエンスセンター 2025年第6回イブニングセミナー 『知能とはなにか ヒトとAIのあいだ』
tagtag
0
79
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
37
知能とはなにかーヒトとAIのあいだー
tagtag
0
140
タンパク質間相互作⽤を利⽤した⼈⼯知能による新しい薬剤遺伝⼦-疾患相互作⽤の同定
tagtag
0
98
PPIのみを用いたAIによる薬剤–遺伝子–疾患 相互作用の同定
tagtag
0
80
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
110
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
1
150
ゲノム解析における射影: 特徴選択ツールとしてのテンソル分解と主成分分析を合理化する理論的根拠
tagtag
0
49
知能とはなにかーヒトとAIのあいだー
tagtag
0
100
Other Decks in Science
See All in Science
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
410
「美は世界を救う」を心理学で実証したい~クラファンを通じた新しい研究方法
jimpe_hitsuwari
1
170
デジタルアーカイブの教育利用促進を目指したメタデータLOD基盤に関する研究 / Research on a Metadata LOD Platform for Promoting Educational Uses of Digital Archives
masao
0
100
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
300
Celebrate UTIG: Staff and Student Awards 2025
utig
0
260
機械学習 - SVM
trycycle
PRO
1
900
Agent開発フレームワークのOverviewとW&B Weaveとのインテグレーション
siyoo
0
350
データマイニング - ウェブとグラフ
trycycle
PRO
0
180
地質研究者が苦労しながら運用する情報公開システムの実例
naito2000
0
290
データマイニング - ノードの中心性
trycycle
PRO
0
280
Collective Predictive Coding as a Unified Theory for the Socio-Cognitive Human Minds
tanichu
0
100
SciPyDataJapan 2025
schwalbe10
0
270
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
115
20k
jQuery: Nuts, Bolts and Bling
dougneiner
65
7.9k
RailsConf 2023
tenderlove
30
1.2k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
How to Think Like a Performance Engineer
csswizardry
27
2k
Into the Great Unknown - MozCon
thekraken
40
2.1k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Documentation Writing (for coders)
carmenintech
75
5.1k
Transcript
主成分分析に基づく教師なし特徴抽出法を 用いたコラーゲン- グリコサミノグリカン メッシュの遺伝子発現への影響 Y.-h. Taguchi, Turki Turki / Polymers
13 (2021) 4117 Y.-h. Taguchi, Turki Turki / Polymers 13 (2021) 4117 本発表スライドは原著論文をChatGPT に読み込ませて「 この論文の内容を20 分の日本語講演スライドにまとめてください。図表を入れるのが難しい場合は 図表をいれられる場所だけを空けてどの図や表をいれるのかの指示をしてくだ さい 」というプロンプトで作成し表を原著論文からコピペして作成しました
2 本講演のゴール(アジェンダ) • 背景:バイオマテリアルと遺伝子発現 • データと課題設定 • 解析法:PCA ベース教師なしFE •
主結果:選択遺伝子と機能的濃縮 • 線形回帰との比較 • 含意・限界・結論
3 背景:足場材× 細胞の相互作用 • バイオマテリアルは接着・生存・増殖・ 転写制御に影響 • Collagen–GAG メッシュは創傷治癒・組織工 学で広く使用
• 標本数が少ない時系列で差異検出は困難
4 課題と着想 • 問:Collagen–GAG 接触で時間とともに遺伝子発現はどう変化? • 課題:小標本・連続変数(時間)に対する頑健な差異検出 • 着想:PCA で時間と相関する潜在成分を抽出→遺伝子選択
5 データセット(GEO: GSE6432 ) • 細胞:IMR90 (ヒト胎児肺由来線維芽細胞) • 条件:treated (Collagen–GAG
接触) vs control (非接触) • 時間:1, 2, 4, 8, 12, 24, 48 h • サンプル数:treated 19 、control 13 、計32 Table 1 (Polymers 13 (2021) 4117 )
6 解析パイプライン概観 • 標準化 → SVD (PCA ) → PC
負荷量と時間の回帰 → 有意PC 決定 • 遺伝子側スコア(u )から有意プローブ選択(ガウス仮定→χ² 、 BH 補正) • 遺伝子ID 変換 → Enrichr で機能的濃縮(GO/KEGG/ARCHS4 など)
7 PCA ベース教師なしFE :要点 • 各条件で独立にPCA を実行 • サンプル側PC 負荷量
vℓ を時間で線形回帰、多重検定補正(BH ) • treated でPC3 が時間と有意(調整p<0.05 )、control で有意PC なし
8 プローブ選択と閾値 • 遺伝子側スコア u3 をガウスと仮定し、χ² でp 値→BH 補正 •
調整p<0.01 で treated 324 プローブ選択(遺伝子変換後 約318 ) • control は選択なし
9 機能的濃縮(GO Biological Process ) • 最上位:regulation of apoptotic process
(抗アポトーシス関連) • 翻訳・ER 標的化・NMD なども有意 • 足場材× 線維芽細胞の生存促進と整合
10 機能的濃縮(GO Cellular Component ) • focal adhesion, cell-substrate junction
が上位 • collagen 含有ECM, ER lumen, リボソーム関連も上位 • 接着・足場応答が関与
11 機能的濃縮(KEGG Pathways ) • Coronavirus disease, Ribosome が強い有意 •
Focal adhesion, PI3K–Akt, Glycolysis/Gluconeogenesis も上位 • ストレス応答・翻訳活性・接着シグナリングの関与
12 外部一貫性チェック(ARCHS4 ) • Cell-lines でIMR90 が首位(本研究の細胞系)
13 • Tissues でFETAL LUNG が上位(IMR90 の由来組織) • 解析の妥当性を支持
15 比較:時刻に対する線形回帰ベースFE • treated で813 プローブ選択、control は選択なし • しかし濃縮の有意性は弱い(調整p が桁違いに大きい)
• PCA-FE は少数プローブでも生物学的に妥当な富化が強い GO Biological Process
16 GO Cellular Component
17 KEGG Pathways
18 ARCHS4
19 ARCHS4
20 なぜPCA-FE が効くのか(直観) • 教師なしに時間に沿った共通成分を抽出 • 小標本でも信号対雑音比を向上 • 連続時間を一括で扱い、多重比較の負担を軽減
21 計算上の工夫と制約 • fsMTS 等の時系列FS :特徴数が多いとメモリO(p²) で実行困難 • マイクロアレイのためRNA-seq 専用ツール(DESeq2/edgeR
) は対象外 • limma/SAM はカテゴリ比較向けで連続時間には不向き
22 バイオロジー的解釈 • 抗アポトーシス関連の富化:足場接触が生存・維持に寄与 • Focal adhesion/PI3K–Akt :接着シグナル→生存・増殖 • 翻訳機構/ER
関連:タンパク質生合成の再編
23 限界と今後 • 教師なしゆえ、外れた場合の改善手段が限定 • RNA-seq および単一細胞データでの再検証が必要 • 足場の物性(剛性・組成)・用量–反応の系統評価
24 実装ガイド(再現手順) • 小規模時系列にPCA-FE を適用(PC× 時間の回帰+BH 補正) • 外部DB (ARCHS4/GO/KEGG
)で一貫性確認 • PC× 時間散布図、ヒートマップ、富化ドットプロットで可視化
25 まとめ(Take-home messages ) • Collagen–GAG 接触で時間依存的遺伝子変動をPCA-FE で検出 • アポトーシス抑制/接着シグナル/翻訳活性が鍵
• 線形回帰より生物学的に妥当な富化が強い • 小標本× 連続時間の解析に有効な実戦的アプローチ
26 付録:図表作成メモ(再現に必要な数値) • treated でPC3 が時間と有意(調整p<0.05 )、control は該当なし • 選択プローブ:treated
324 (遺伝子変換後 約318 )、control 0 • GO BP 最上位:regulation of apoptotic process (例:調整p ≈ 2.5×10-13 ) • GO CC 最上位:focal adhesion (例:調整p ≈ 4.8×10-27 ) • KEGG 上位:Coronavirus disease (≈ 1.2×10-10 )、Ribosome (≈ 6.7×10-10 )、Focal adhesion (≈ 1.2×10-4 ) • 比較:線形回帰はtreated 813 プローブ選択も富化の有意性は弱 い(例:GO BP トップの調整p ≈ 4.6×10-2 )