超伝導体のTcを機械学習で予測する論文を追試してみる


 【イントロ】

 近年深層学習を始めとしたAI技術の発展が著しく、基礎、応用研究の両面で活用が進められています[1]。
 特にAI技術の材料科学への適用はマテリアルインフォマティクスと呼ばれ、新規材料の発見や生産プロセスの最適化への活用が進められています[2]。
 機械学習の導入による新規材料の開発が求められている分野の1つが、超伝導体材料開発の分野です。より高温で超伝導状態となる物質の開発のため、日夜様々な研究がなされています[3]。
 そこで本記事では、機械学習により物質の超伝導転移温度(Tc)を予測することを試みた論文の追試を行った結果をまとめてみました。

【方法】

 参考にした論文は、Kam Hamidiehによる論文” A Data-Driven Statistical Model for Predicting the Critical Temperature of a Superconductor”[4]です。一番簡単そうだったことと、著者が使用したデータを公開していたことが、こちらの論文を参考にした理由です。
 この論文では、以下のデータ、手法を用いて、超伝導体の構成元素の物性値からそのTcを予測するモデルを提案しています。
データ:NIMSの超伝導データベース
手法:XGBoost
 使用している物性値は次のとおりです(図1)。
図1、使用された物性値


 また、物性値に以下の処理を加え、特徴量エンジニアリングを行っています(図2)。
図2、特徴量エンジニアリングの方法

 追試としては、Scikit-learnを用いた決定木による回帰モデルによる上記論文の再現を目的としました。使用したコードは、Githubリポジトリ[5]に保管しています。データセットは「data_source」ファイルに記載している論文の参考HPページ[4]に情報があります。
論文[4]の解説と実装もそちらのHPに記載されているのでご参考ください。

【結果】

 決定木を用いて予測したTcと実際のTcの関係は以下の通りです。R2値は0.85程度となり、比較的強い正の相関を示しています(図3)。
図3、決定木によるTcの予測値と実測値

一方、論文で示された値はR2=0.92程度となっており、XGBoostの方が相関が強く出ていることが見て取れます(図4)。
図4、XGBoostによるTcの予測値と実測値

 決定木による分析で上位の重要な変数として出てきた変数は以下の通りです。図5からは、構成元素間の熱伝導率差と重み付き平均値が比較的重要な変数となっていることが読み取れます。この結果は、一部の重要度の順番は異なるものの、XGBoostによる結果と似た結果となっています(図6)。
図5、決定木による重要変数



図6、XGBoostによる重要変数

【考察】

 Tcを予測するためのパラメータとして、物質の構成元素の熱伝導率(の差)が重要と判断された原因を考えてみます。
 超伝導現象を説明するBCS理論によると、フォノン媒介による超伝導メカニズムにおいて、転移温度Tcは、以下の式で表されることが知られています[6]。
            Tc ~ T_θ ・ exp(-1/N(0)V)
ここでT_θはデバイ温度、N(0)はフェルミエネルギーでの状態密度、Vは相互作用の強さを示しています。一方で熱伝導率κは、低温では以下の式で表されます[7]。
            κ ~ (T/T_θ)^2
ここで、Tは温度を示しています。
上の2式から、ある温度でのκとTcはT_θを介して相関していることがわかります。
このことが、Tcの予測に対してκが重要な変数として寄与する原因と考えられます。
また、この結果は、学習に用いたデータベースの多くの物質がフォノン媒介の超伝導体で有ることを示唆していると考えられます。

【まとめ】

 本記事では、機械学習を用いたTc予測の論文を追試することを試みました。XGBoostを用いた論文と同様の結果をScikit-learnの決定木を用いて再現することができました。
また、Tcの予測に構成元素の熱伝導率差が重要なことを確認し、そこからフォノン媒介の超伝導メカニズムによる超伝導体がデータベースの多くを占めていることを推察しました。
 しかし、機械学習するにはデータセットの準備って大変ですねということが、よくわかる今回の取り組みでした。データの整備って大切だな~。

【参考文献】

[3] Stanev, V., Oses, C., Kusne, A.G. et al. Machine learning modeling of superconducting critical temperature. npj Comput Mater 4, 29 (2018).
[4] Kam Hamidieh, arXiv:1803.10260
[6] BCS theory(Wiki)

コメント

このブログの人気の投稿

学振採用者はどこへ消えた?

物理系研究関係者、ツイッターやりすぎランキング(ぶひん調べ)

オレ達はあと何本論文を書けば東大教授になれるんだ?