论文部分内容阅读
自2012年,随着计算硬件性能的提高和算法的革新,机器学习,特别是深度学习技术得到长足发展。大数据与机器学习结合,催生了科研界和工业界的多项新应用。在化学领域,建立大规模数据库仍是机器学习研究的关键。在这些数据库上引入机器学习方法探究规律逐渐成为研究热点。金属有机框架(Metal-Organic Frameworks,MOFs)是由金属簇或金属离子作为节点、有机多齿配体作为链接器自组装而成的一类无机-有机杂化多孔材料。近年来,不同结构和形貌的MOFs在选择性催化、能量转化、可见光通讯、抗癌药物研发等领域展现前景,使得针对性地合成MOF、调控MOF形貌的研究受到人们关注。在这些研究中产生的大量合成、表征数据则为使用机器学习方法创造了条件。本文的工作中,我们在MOF领域引入机器学习技术进行了两个方向的探索和尝试。首先,MOF合成领域尚未有数据库被报导,使得相关研究中,引入机器学习方法缺乏数据集支持。因此,我们使用自然语言处理方法,完成了一套可以自动提取MOF合成配方的框架。通过该框架,我们从70篇经典的使用溶剂热法合成MOF的文献中提取了MOF名称、反应温度、反应时间、合成原料及其用量信息,确定了该框架的可靠性。辅以少量手动校正,初步建立了一个MOF合成数据库。其次,在研究合成配方对MOF形貌影响的研究中,面对大量需要定量测量的电镜照片,引入了目前主流的Mask R-CNN目标分割检测网络,解决了晶体难以被检测、分割的问题,避免了费时费力的手工测量过程。以上两个工作,前者为普适性的MOF合成规律研究提供了引入机器学习方法的必要基础,后者则为特定体系的MOF形貌调控研究提供了高效、便利地形貌测量工具。两个工作共同为机器学习技术引入MOF领域提供了思路和示范。最后,本文还介绍了两个使用密度泛函理论(Density Functional Theory,DFT)计算和分子动力学(Molecular Dynamics,MD)模拟探究MOF材料催化机制的工作。辅助完成了机理方面的研究,以及中间体结构的预测。