リード最適化での構造変換の指針 • 入力: 化合物と標的への活性値の対 𝑚𝑛 , 𝑦𝑛 ∈ ℳ × 𝒴 𝑛=1 𝑁 • 出力: 活性予測モデル 𝑓: ℳ → 𝒴 適用範囲 入力空間の中で予測が信頼できる範囲を 規定する • 手法例: 訓練データから適当に定める Hansch, Corwin, and Toshio Fujita. "p-σ-π Analysis. A Method for the Correlation of Biological Activity and Chemical Structure." Journal of the American Chemical Society 86.8 (1964): 1616-1626. Gadaleta, Domenico, et al. "Applicability domain for QSAR models: where theory meets reality." International journal of quantitative structure-property relationships (IJQSPR) 1.1 (2016): 45-63. 1点1点が 訓練事例 化合物空間
リード最適化での構造変換の指針 • 入力: 化合物と標的への活性値の対 𝑚𝑛 , 𝑦𝑛 ∈ ℳ × 𝒴 𝑛=1 𝑁 • 出力: 活性予測モデル 𝑓: ℳ → 𝒴 適用範囲 入力空間の中で予測が信頼できる範囲を 規定する • 手法例: 訓練データから適当に定める Hansch, Corwin, and Toshio Fujita. "p-σ-π Analysis. A Method for the Correlation of Biological Activity and Chemical Structure." Journal of the American Chemical Society 86.8 (1964): 1616-1626. Gadaleta, Domenico, et al. "Applicability domain for QSAR models: where theory meets reality." International journal of quantitative structure-property relationships (IJQSPR) 1.1 (2016): 45-63. 軸ごとに 最大値・最小値 を求める
リード最適化での構造変換の指針 • 入力: 化合物と標的への活性値の対 𝑚𝑛 , 𝑦𝑛 ∈ ℳ × 𝒴 𝑛=1 𝑁 • 出力: 活性予測モデル 𝑓: ℳ → 𝒴 適用範囲 入力空間の中で予測が信頼できる範囲を 規定する • 手法例: 訓練データから適当に定める Hansch, Corwin, and Toshio Fujita. "p-σ-π Analysis. A Method for the Correlation of Biological Activity and Chemical Structure." Journal of the American Chemical Society 86.8 (1964): 1616-1626. Gadaleta, Domenico, et al. "Applicability domain for QSAR models: where theory meets reality." International journal of quantitative structure-property relationships (IJQSPR) 1.1 (2016): 45-63. PCAしつつ軸ごとに 最大値・最小値を 求める
リード最適化での構造変換の指針 • 入力: 化合物と標的への活性値の対 𝑚𝑛 , 𝑦𝑛 ∈ ℳ × 𝒴 𝑛=1 𝑁 • 出力: 活性予測モデル 𝑓: ℳ → 𝒴 適用範囲 入力空間の中で予測が信頼できる範囲を 規定する • 手法例: 訓練データから適当に定める Hansch, Corwin, and Toshio Fujita. "p-σ-π Analysis. A Method for the Correlation of Biological Activity and Chemical Structure." Journal of the American Chemical Society 86.8 (1964): 1616-1626. Gadaleta, Domenico, et al. "Applicability domain for QSAR models: where theory meets reality." International journal of quantitative structure-property relationships (IJQSPR) 1.1 (2016): 45-63. 類似している 訓練事例の有無で 決める
• 骨格に応じた分割やクラスタリングに 基づく分割が望ましい 事例2: リード最適化 • 目的: 有望な骨格の局所最適化 • Time-split: 試験日時をもとに分割 骨格ごとに評価したりもする 骨格B 骨格A 骨格C リード最適化で 探索したい範囲 骨格D VSで探索したい 範囲 Sheridan, Robert P. "Time-split cross-validation as a method for estimating the goodness of prospective prediction." Journal of chemical information and modeling 53.4 (2013): 783-790.
• リガンドの立体構造 • 出力: • 標的タンパク質とリガンドの複合体 • 結合親和性 注)様々な事情により,正確な出力が 求まるとは限らない 共結晶構造: Nagar, Bhushan, et al. "Crystal structures of the kinase domain of c-Abl in complex with the small molecule inhibitors PD173955 and imatinib (STI-571)." Cancer research 62.15 (2002): 4236-4243. ドッキング: Forli, Stefano, et al. "Computational protein–ligand docking and virtual drug screening with the AutoDock suite." Nature protocols11.5 (2016): 905-919. リガンド 標的タンパク質
スコア関数 • 力場に基づいたスコア関数 vdW/静電相互作用など • 経験的スコア関数 • 適当なポテンシャル関数の線形和 • 重みはデータから推定 最適化アルゴリズム • MCMC • 勾配法 • 遺伝的アルゴリズム See. for example. Trott, Oleg, and Arthur J. Olson. "AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading." Journal of computational chemistry 31.2 (2010): 455-461.
ドッキング 分子構造の最適化 Venkatasubramanianら(1995年) • 目的: ポリマーの最適化 物性値を指定した値に近づける • 手法: 遺伝的アルゴリズム • 主鎖・側鎖の構造の候補を与える • 分子構造をビットベクトルで表現 スクリーニング結果 活性予測 HTS ヴァーチャル スクリーニング結果 ライブラリ Review paper on molecular optimization: De Julian-Ortiz, J. V. "Virtual Darwinian Drug Design QSAR Inverse Problem, Virtual Combinatorial Chemistry, and Computational Screening." Combinatorial Chemistry & High Throughput Screening 4.3 (2001): 295-310. Venkatasubramanian, Venkat, King Chan, and James M. Caruthers. "Evolutionary design of molecules with desired properties using the genetic algorithm." Journal of Chemical Information and Computer Sciences 35.2 (1995): 188-195.
簡単に計算/予測できる特徴量 • 分子量 • 水素結合のドナー/アクセプタの数 • 全炭素に対するsp3炭素の割合 多いほど立体的になる • logP(脂溶性の高さ(の推定値)) • TPSA(トポロジカル極性表面積) 極性をもつ表面積の推定値 Figure cited from Rogers, David, and Mathew Hahn. "Extended-connectivity fingerprints." Journal of chemical information and modeling 50.5 (2010): 742-754. Wildman, Scott A., and Gordon M. Crippen. "Prediction of physicochemical parameters by atomic contributions." Journal of chemical information and computer sciences 39.5 (1999): 868-873. Ertl, Peter, Bernhard Rohde, and Paul Selzer. "Fast calculation of molecular polar surface area as a sum of fragment-based contributions and its application to the prediction of drug transport properties." Journal of medicinal chemistry 43.20 (2000): 3714-3717. 0 1 1 0 0 1 0 0 0 ・・・ 𝒗 = ∈ 0,1 2048 固定長 ベクトル 固定長 ベクトル
ラベル付き辺 SMILESによる文字列表現 Simplified molecular input line entry system • グラフを文字列表現したもの • 枝分かれは括弧で表現 • 環は開いて数字で対応付け Oc1ccc(NC(=O)C)cc1 Weininger, David. "SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules." Journal of chemical information and computer sciences28.1 (1988): 31-36. 可変長 ベクトル グラフ
et al. "Learning to Extend Molecular Scaffolds with Structural Motifs."International Conference on Learning Representations 2022. 今のグラフをもとに 次に追加するパーツを選ぶ or 終了 繰り返し 潜在ベクトル𝒛
生成した化合物は,良さそうであれば 合成して試験したい →合成経路も知りたい • 化学反応に基づく生成モデルを用いる 特許の回避 • 薬として売り出すには既存の 物質特許を回避したい • 特許を取られているかどうかを 報酬に追加 Human-in-the-loop • ADMETのどの制約を重視するのかは 創薬化学者次第なところがある • 創薬化学者からのフィードバックを 活用する Lim, Jaechang, et al. "Scaffold-based molecular design with a graph generative model." Chemical science 11.4 (2020): 1153-1164. Maziarz, Krzysztof, et al. "Learning to Extend Molecular Scaffolds with Structural Motifs." International Conference on Learning Representations 2022. Gottipati, Sai Krishna, et al. "Learning to navigate the synthetically accessible chemical space using reinforcement learning." International conference on machine learning. PMLR, 2020. Shimizu, Yugo, et al. "AI-driven molecular generation of not-patented pharmaceutical compounds using world open patent data." Journal of Cheminformatics 15.1 (2023): 120. Sundin, Iiris, et al. "Human-in-the-loop assisted de novo molecular design." Journal of Cheminformatics 14.1 (2022): 86.