Upgrade to Pro — share decks privately, control downloads, hide ads and more …

日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023

日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023

nano tech2023でのPFCC特別講演の資料です(公開可能な部分のみアップしております)。

タイトル
日本一やさしいマテリアルズ・インフォマティクスへの導き
~ 材料開発者は、マテリアルズ・インフォマティクスに何を求めるのか ~

概要
近年、素材産業を変革するソリューションとしてマテリアルズ・インフォマティクス(MI)への注目が高まっています。日本国内では、化学メーカーなどが積極的に取組みを継続し、成功事例が報告され、関連情報も増加してきました。一方、MI関連情報が増加したことにより「これからMIに着手する方々」にとっては、現状の整理・俯瞰が難しくなっているという側面もあります。
そこで、本講演ではMIの現状を整理・俯瞰し、その文脈における「汎用原子レベルシミュレータMatlantis(弊社提供サービス)」の位置づけを紹介します。また、ひとりの材料開発者(登壇者)のケースを例に、MIの世界に一歩踏み出すモチベーションを赤裸々にお話します。

講演者
PFCC 柴田ラビ

https://matlantis.com/ja/

Matlantis

July 25, 2023
Tweet

More Decks by Matlantis

Other Decks in Technology

Transcript

  1. マテリアルズ・インフォマティクス:概観 情報処理技術を活用して材料開発を推進すること 8 y x1 x2 x3 ・・・ 1 2

    3 ・ ・ ・ 元となるデータ 既知 y x1 x2 x3 ・・・ 1 2 3 ・ ・ ・ ? 既知 未知のyを予測 予測対象のデータ 評価 y = f(X)
  2. マテリアルズ・インフォマティクス:課題① ① データがあるか? 9 y x1 x2 x3 ・・・ 1

    2 3 ・ ・ ・ 元となるデータ 既知 y x1 x2 x3 ・・・ 1 2 3 ・ ・ ・ ? 既知 未知のyを予測 予測対象のデータ 評価 y = f(X) ・ データ数がそもそも少ない ・ データ取得の属人化      (記録のバラツキなど) ・ データ整理 / 整形で     ギブアップ 
  3. マテリアルズ・インフォマティクス:課題② ② モデルの精度は十分か? 10 y x1 x2 x3 ・・・ 1

    2 3 ・ ・ ・ 元となるデータ 既知 y x1 x2 x3 ・・・ 1 2 3 ・ ・ ・ ? 既知 未知のyを予測 予測対象のデータ 評価 y = f(X) ・ データ科学の知見不足 ・ 材料領域の知見不足     ・ 問題設定があいまい  (目的が不明確)
  4. マテリアルズ・インフォマティクス:課題③ ③ モデルの適用範囲は十分か? 11 y x1 x2 x3 ・・・ 1

    2 3 ・ ・ ・ 元となるデータ 既知 y x1 x2 x3 ・・・ 1 2 3 ・ ・ ・ ? 既知 未知のyを予測 予測対象のデータ 評価 y = f(X) ・ 信頼できる予測範囲が限定的  (データのある領域に限られる) ・ 研究開発者の期待を満たせない ・ データベース探しの旅へ
  5. なぜ、このような課題が生じるのか 「元となるデータがあり、それをもとに(近似式をつくって)予測をする」 というアプローチであるため 12 y x1 x2 x3 ・・・ 1

    2 3 ・ ・ ・ 元となるデータ 既知 y x1 x2 x3 ・・・ 1 2 3 ・ ・ ・ ? 既知 未知のyを予測 予測対象のデータ y = f(X) ・実験データ ・文献 ・データベース など
  6. マテリアルズ・インフォマティクス:現状の俯瞰 前述の課題に向き合いながらマテリアルズ・インフォマティクス従事者 は粘り強く活動継続し、その結果、関連事例/ニュースは増加傾向 16 データを 集める データを 整理する 法則を 見つける

    予測する 評価する 課題 ①データは? ②精度は? ③適用範囲は? (リソースは?) 内製 外部 人材育成 自社ツール 人材育成 ツール提供 受託解析 アドバイザリ 8~10社 20社 < 5~8社 3社 3~5社 8~10社 5~6社 1社 4~5社 4~6社 2022年12月 柴田調べ
  7. マテリアルズ・インフォマティクス:現状の俯瞰 前述の課題に向き合いながらマテリアルズ・インフォマティクス従事者 は粘り強く活動継続し、その結果、関連事例/ニュースは増加傾向 17 データを 集める データを 整理する 法則を 見つける

    予測する 評価する 課題 ①データは? ②精度は? ③適用範囲は? (リソースは?) 内製 外部 人材育成 自社ツール 人材育成 ツール提供 受託解析 アドバイザリ 8~10社 20社 < 5~8社 3社 3~5社 8~10社 5~6社 1社 4~5社 4~6社 大手、中堅化学メーカーが注力 大手化学メーカーが注力し、サービス化もあり 多数 自動実験 ta 2022年12月 柴田調べ
  8. マテリアルズ・インフォマティクス:現状の俯瞰 前述の課題に向き合いながらマテリアルズ・インフォマティクス従事者 は粘り強く活動継続し、その結果、関連事例/ニュースは増加傾向 18 データを 集める データを 整理する 法則を 見つける

    予測する 評価する 課題 ①データは? ②精度は? ③適用範囲は? (リソースは?) 内製 外部 人材育成 自社ツール 人材育成 ツール提供 受託解析 アドバイザリ 8~10社 20社 < 5~8社 3社 3~5社 8~10社 5~6社 1社 4~5社 4~6社 大手、中堅化学メーカーが注力 大手化学メーカーが注力し、サービス化もあり 多数 MI人材育成サービスの提供は増加傾向 データベース、実験ノート 条件探索(ベイズ最適化など) (プロジェクト単位での)解析サービス 他サービスに付随して実施される場合が多い 自動実験 ta 自動実験 ta 2022年12月 柴田調べ
  9. なぜ、このような課題が生じるのか 再掲 「元となるデータがあり、それをもとに(近似式をつくって)予測をする」 というアプローチであるため 19 y x1 x2 x3 ・・・ 1

    2 3 ・ ・ ・ 元となるデータ 既知 y x1 x2 x3 ・・・ 1 2 3 ・ ・ ・ ? 既知 未知のyを予測 予測対象のデータ y = f(X) ・実験データ ・文献データ ・データベース など
  10. マテリアルズ・インフォマティクス:別の視点 シミュレーションの活用 20 人間 コンピュータ※ 帰納的 演繹的 実験 理論 機械学習アプローチ

    (~前ページ) シミュレーション 元となるデータ不要 ※ 実際には「コンピュータ」の活用においても   人間が考えて実行することが必要です。   また、機会学習アプローチとシミュレーション   を組み合わせることもしばしば行われます。
  11. 約10万倍 高速 Matlantisの性能①:従来手法に対する優位性 第一原理計算 Matlantis 2ヶ月 (外挿値) 0.3秒 0.1秒 2時間

    第一原 理計算 原子数 第一原理 計算 約2千万倍 高速 第一原理計算条件 ・solver = QUANTUM ESPRESSO (PWscf) ・ver:6.4.1 ・PP:Pt.pbe-n-kjpaw_psl.1.0.0.UPF ・Ecutoff:40 Ry (≒544 eV) ・Xeon Gold 6254 3.1GHz x 2 (36 cores) ・RAM:384 GB Fcc Ptバルク構造一点計算時間 28 従来手法(第一原理計算)と比べて圧倒的に速い
  12. … 教師データ(数千万) 分子・結晶等様々な構造の第一原理計算を実施 (PFNの強力計算設備を活用) GNN 物理知識を取り込んだ 独自のAIモデル構築 エネルギー Matlantis予測値 学習・出力

    教師データを再現できるまで モデルの学習を実施  エネルギー DFT(テストデータ) Ex. molecule Ex. cluster Ex. slab Ex. crystal Ex. adsorption Ex. disordered ・観測バイアス ・モデルバイアス ・学習バイアス 参考書籍:AI技術の最前線 これからのAIを読み解く先端技術 73 | 岡野原 大輔 |本 | 通販 | Amazon Matlantisの仕組み:どのようにして実現しているのか 大量の学習データと独自ノウハウにより、最強のモデルを作っている 30
  13. マテリアルズ・インフォマティクスとMatlantisの関係 33 ここまでの話を踏まえての俯瞰 人間 コンピュータ 帰納的 演繹的 実験 理論 機械学習アプローチ

    シミュレーション 企画 基礎研究 製品開発 工業化 検討 生産 演繹的アプローチ 帰納的アプローチ マテリアルズ・インフォマティクス (の文脈で語られることが多い)
  14. もし、今の私が材料開発をするとしたら・・・ 9:00 出社 計画・チームMTG 10:00 実験 12:00 ランチ 13:00 MTG

    14:00 実験 解析・まとめ 17:00 18:00 雑務 退社 社内の業務アップデートの取り組みには、きっちりと参画する ターゲット MTG 雑務 実験操作 データ解析 アプローチ ・自動実験装置 ・実験計画(DoE) ・電子実験ノート ・機械学習による解析 ・ムダ削減 ・生産性向上マインド 研究開発 DX 働き方 改革 35
  15. もし、今の私が材料開発をするとしたら・・・ シミュレーション(計算屋の友人)の力を借りて、楽しむ心を育み続ける 9:00 出社 計画・チームMTG 10:00 実験 12:00 ランチ 13:00

    MTG 14:00 実験 解析・まとめ 17:00 計算セット 18:00 雑務 退社 企画 基礎研究 製品開発 工業化 検討 生産 計算化学が発展した元々のモチベーション :安全にアイディアを試したい(大野公一 氏) 楽しむ心 MTG 雑務 実験操作 データ解析 ・自動実験装置 ・実験計画(DoE) ・電子実験ノート ・機械学習による解析 ・ムダ削減 ・生産性向上マインド 研究開発 DX 働き方 改革 ターゲット アプローチ 36
  16. 37