(资料图)
科学家们已经开发出一种机器学习算法,可以预测有机分子中的电子能量水平。这一突破是在一个超过22000个分子的数据库中训练出来的,技术上的进步可以加速像药品这样的功能分子的设计。
有机化学即对碳基分子的研究,不仅是生物体科学的基础,而且对许多当前和未来的技术至关重要,如有机发光二极管(OLED)显示器。了解一种材料分子的电子结构是预测该材料化学特性的关键。
在东京大学工业科学研究所的研究人员最近发表的一项研究中,开发了一种机器学习算法来预测有机分子内的状态密度,即电子在材料分子内的基态所能占据的能级数量。这些基于光谱数据的预测对有机化学家和材料科学家分析碳基分子时有很大帮助。
东京大学工业科学研究所的研究人员使用人工智能来帮助解释材料科学光谱实验产生的数据,这可以帮助开发新的药物和有机导体。资料来源:东京大学工业科学研究所
通常用来寻找状态密度的实验技术可能很难解释。被称为核心损失光谱的方法尤其如此,它结合了能量损失近边缘光谱(ELNES)和X射线吸收近边缘结构(XANES)。这些方法在材料样品上照射一束电子或X射线;由此产生的电子散射和对材料分子发射的能量的测量使得感兴趣的分子的状态密度可以被测量。然而,光谱所具有的信息只是在激发分子的电子缺失(未被占据)状态。
为了解决这个问题,东京大学工业科学研究所的团队训练了一个神经网络机器学习模型来分析核心损耗光谱数据并预测电子状态的密度。首先,通过计算超过22000个分子的状态密度和相应的核损光谱,构建了一个数据库。他们还添加了一些模拟的噪声。然后,在核损光谱上对该算法进行了训练,并对其进行了优化,以预测基态下占位和非占位状态的正确密度。
"我们试图用一个由较小分子训练的模型来推断对较大分子的预测。我们发现通过排除微小的分子可以提高准确性,"主要作者Po-Yen Chen解释说。
该团队还发现,通过使用平滑预处理和向数据添加特定的噪声,可以改善对状态密度的预测,这可以加速预测模型在真实数据上的应用。
高级作者Teruyasu Mizoguchi说:"我们的工作可以帮助研究人员了解分子的材料特性,并加速功能分子的设计。这可以包括药品和其他令人兴奋的化合物。"