Upgrade to Pro — share decks privately, control downloads, hide ads and more …

第2回Matlantis User Conference_20230421_畠山歓先生

第2回Matlantis User Conference_20230421_畠山歓先生

タイトル
有機材料を専門とする実験研究者によるMatlantisの活用事例

講演者
東京工業大学 物質理工学院 材料コース 早川研究室 助教 畠山 歓 先生

略歴:2018年早稲田大学先進理工学専攻一貫制博士課程修了。博士(工学)。同年同大学応用化学科講師(任期付)を経て、2023年4月より現職。2022年よりJST創発的研究支援事業に従事。機能性高分子、有機電気化学、マテリアルズ・インフォマティクスを専門とする。

講演概要
機能性高分子の合成と計測を専門とする実験研究者が、どのような期待と課題意識を持ちながらAI分子シミュレータMatlantisを利用しているかについて発表する。DFT、MD計算、更にはオープンソースのAIシミュレータ等と比較も交えながら、Matlantisの特徴を実験屋の視点で考察する。実例として、分子集合体の構造計算に加え、本ソフトウェアによって推定可能な諸物性(密度・拡散係数・粘度・熱伝導度等)を、実材料で計算した際の精度や処理速度について示す。また、Matlantisでも計算が困難な構造や物性を推定するための機械学習との連携状況についても報告する。

Matlantis

July 25, 2023
Tweet

More Decks by Matlantis

Other Decks in Technology

Transcript

  1. 経歴 • 早稲田 • 高校~大学院(博士) +教員5年 • 東工大 • 2023年4月~

    • 助教 • 専門 • 高分子化学: 合成、計測、デバイス化など • データ科学: マテリアルズ・インフォマティクス 2
  2. 自動化した方が良い作業の例 • 実験 • 得られたデータの分析 • 結果の予測と条件の提案 • 実験そのもの(by robot)

    • 情報処理 • 既知データの収集・解析・課題の抽出 • 報告書の作成と要約 16 GPT-1000くらいまでいけば、 分子現象も正確にシミュレーション してくれる可能性はあるが、、
  3. Black box予測は気持ち悪い 17 物性 Kan Hatakeyama-Sato, Recent advances and challenges

    in experiment- oriented polymer informatics, Polymer Journal (2022).
  4. ポリマーの 屈折率予測 high refractive index polymer lens [関連発表] 2022年 ケモインフォ討論会

    2B04 「Matlantisを用いた有機分子の記述子生成 と機械学習による実測物性の予測」 (早大理工) ◦畠山 歓, 小柳津 研一 18
  5. 説明変数1/3 比較的まじめに計算した物性パラメータ Matlantis density: Matlantisで計算した物質密度(相互作用込み) RDKit density: RDKitで計算した密度(真空1分子系) vol: RDKitで計算した真空1分子の体積

    alpha_0.0: Gaussianで計算した分極率 (∞ nm) alpha_0.0694: Gaussianで計算した分極率 (657 nm) alpha_0.0773: Gaussianで計算した分極率 (589 nm) ※ Gaussian: PM7で構造最適化後、B3LYP/6-31G(d,p)でメイン計算 20
  6. 説明変数2/3 RDKitで計算した分子記述子105種(意味が比較的明瞭なもの) MolWt, HeavyAtomMolWt, ExactMolWt, NumValenceElectrons, NumRadicalElectrons, MaxPartialCharge, MinPartialCharge, MaxAbsPartialCharge,

    MinAbsPartialCharge, TPSA, FractionCSP3, HeavyAtomCount, NHOHCount, NOCount, NumAliphaticCarbocycles, NumAliphaticHeterocycles, NumAliphaticRings, NumAromaticCarbocycles, NumAromaticHeterocycles, NumAromaticRings, NumHAcceptors, NumHDonors, NumHeteroatoms, NumRotatableBonds, NumSaturatedCarbocycles, NumSaturatedHeterocycles, NumSaturatedRings, RingCount, MolLogP, MolMR, fr_Al_COO, fr_Al_OH, fr_Al_OH_noTert, fr_ArN, fr_Ar_COO, fr_Ar_N, fr_Ar_NH, fr_Ar_OH, fr_COO, fr_COO2, fr_C_O, fr_C_O_noCOO, fr_C_S, fr_HOCCN, fr_Imine, fr_NH0, fr_NH1, fr_NH2, fr_N_O, fr_Ndealkylation1, fr_Ndealkylation2, fr_Nhpyrrole, fr_SH, fr_aldehyde, fr_alkyl_carbamate, fr_alkyl_halide, fr_allylic_oxid, fr_amide, fr_amidine, fr_aniline, fr_aryl_methyl, fr_azide, fr_azo, fr_barbitur, fr_benzene, fr_benzodiazepine, fr_bicyclic, fr_diazo, fr_dihydropyridine, fr_epoxide, fr_ester, fr_ether, fr_furan, fr_guanido, fr_halogen, fr_hdrzine, fr_hdrzone, fr_imidazole, fr_imide, fr_isocyan, fr_isothiocyan, fr_ketone, fr_ketone_Topliss, fr_lactam, fr_lactone, fr_methoxy, fr_morpholine, fr_nitrile, fr_nitro, fr_nitro_arom, fr_nitro_arom_nonortho, fr_nitroso, fr_oxazole, fr_oxime, fr_para_hydroxylation, fr_phenol, fr_phenol_noOrthoHbond, fr_phos_acid, fr_phos_ester, fr_piperdine, fr_piperzine, fr_priamide, fr_prisulfonamd, fr_pyridine, fr_quatN, fr_sulfide, fr_sulfonamd, fr_sulfone, fr_term_acetylene, fr_tetrazole, fr_thiazole, fr_thiocyan, fr_thiophene, fr_unbrch_alkane, fr_urea, 21
  7. 説明変数3/3 Group Contribution法で推定した分子物性 ※ 一種の機械学習。分子構造をもとに物性を線形モデルで予測。既存 の学習モデルを使用 ACS Omega 2017, 2,

    12, 8682–8688 https://pubs.acs.org/doi/full/10.1021/acsomega.7b01464 BoilingPoint, MeltingPoint, CriticalTemp, CriticalPress, CriticalVolume, EnthalpyForm, GibbsEnergy, HeatCapacity, EnthalpyVap, EnthalpyFus, LiquidVisco, CrystalSolub_1, CrystalSolub_2, AmorphSolub_1, AmorphSolub_2, 22
  8. 分子体積𝑉の計算 • Matlantis (v. 3.0.0)を使用 • セル内に分子のユニット構造を充填 • 周期的境界条件 •

    20分子 • ランダムに配置 • 分子構造の最適化 • 分子内の応力を下げるように構造変形 • ソルバー: LBFGSLineSearch • 0 Kに急速冷凍するイメージ • (構造ではなく)密度が収束したら計算終了 25
  9. 体積計算の主な近似2 • Matlantisの誤差 • DFTの精度 • PBE汎関数 • PAWポテンシャル (VASP5.4.4)

    • d3補正 • 学習モデルの誤差 • それぞれ、どの程度の誤差かは詳細不明 • 芳香環やハロゲンが多い場合は、誤差が大きい印象 27
  10. 密度 (∝1/V)計算の結果 30 Matlantis (20分子系、N = 10) 真空1分子 (RDKitで分子体積を計算) 相関係数:

    0.93 相関係数: 0.92 RDKitでもそれなりに精度が出るが、Matlantisの方がわずかに高性能
  11. 予測式の中身 • 屈折率𝑛の理論式(ローレンツ・ローレンツ式) • 𝑛2−1 𝑛2+2 = 4𝜋 3 ∙

    𝛼pred 𝑉pred • 𝛼pred = σ 𝑐𝑖 𝑥𝑖 (𝑐𝑖 = const.) • 𝑉pred = σ 𝑏𝑖 𝑥𝑖 (𝑑𝑖 = const.) • 𝑥𝑖: 説明変数 • シミュレーションで計算した密度や分極率など • 分子記述子 • 推定物性 34
  12. 密度の回帰式 35 係数 備考 RDKit density 0.119867 RDKitの密度 Matlantis density

    0.090046 Matlantisの密度 JR_CriticalPress 0.018928 推定される臨界密度 rdkit_fr_NH0 0.007591 NHの数 rdkit_fr_alkyl_halide 0.004204 アルキルハライドの数 JR_AmorphSolub_1 0.002374 推定される溶解度 rdkit_fr_nitrile 0.000203 ニトリルの数
  13. 分極率の回帰式 36 係数 rdkit_MolMR 7.891426 vol 6.267404 alpha_0.0 5.371888 rdkit_ExactMolWt

    3.58794 rdkit_MolWt 3.571914 rdkit_HeavyAtomMolWt 3.062773 rdkit_fr_halogen -2.892719 alpha_0.0694 2.563431 alpha_0.0773 2.529426 JR_GibbsEnergy 2.111205 rdkit_NumValenceElect rons 2.019513 rdkit_HeavyAtomCount 1.959138 … …
  14. 屈折率の計算 37 • 屈折率𝑛の理論式(ローレンツ・ローレンツ式) • 𝑛2−1 𝑛2+2 = 4𝜋 3

    ∙ 𝛼pred 𝑉pred • 𝛼pred = σ 𝑐𝑖 𝑥𝑖 (𝑐𝑖 = const.) • 𝑉pred = σ 𝑏𝑖 𝑥𝑖 (𝑑𝑖 = const.) MSE 0.0017 分子構造から直接予測(RFR) MSE 0.0070 This work
  15. イオン液体 の拡散係数 • NPT • プレアニーリング&実計算 • 10分子 • 353

    K • Time step: 1.5 fs • Total: 300 ps • 採用値 • 3回の独立な計算後の中央値 • 所要時間約1日/分子