APP下载

基于单元素掺杂的TiO2 光催化材料数据库

2021-04-15王宗国郭令举万萌李凯刘志威郭佳龙

关键词:能带光催化数据库

王宗国,郭令举,万萌,李凯,刘志威,2,郭佳龙,2

1.中国科学院计算机网络信息中心,北京 100190

2.中国科学院大学,北京 100190

3.中国科学院国家纳米科学中心,北京 100190

引 言

TiO2因具有价格低廉、无毒、高催化活性和稳定性等特点,近年来在光催化领域被广泛应用[1-3]。然而,由于其较大的本征能隙(锐钛矿能隙大小为3.2 eV),严重影响了对太阳光的利用率。已有研究结果表明,通过掺杂金属或非金属元素可以对TiO2的能隙进行调节,提高TiO2在可见光范围内的光催化性质[4-17]。针对TiO2材料的掺杂研究结果仅局限于几种代表性的掺杂元素,无法对掺杂进行系统的分析,并且大多数已经报道的计算都是基于不同的软件和方法,搜集的数据也很难直接进行对比。为此,需要一个系统而全面的计算,能够覆盖元素周期表中所有可能的掺杂元素,更加深入地探讨掺杂对TiO2性质的影响。

计算机硬件的发展和高通量计算技术驱动了计算材料的飞速发展。随着材料基因工程的实施,开发出了一些高通量计算框架和筛选的流程[18-20],计算材料数据库也不断发表,但是目前尚未发现基于TiO2掺杂数据库的报道。构建一个特定材料不同掺杂元素的数据库,一方面对于发现材料新特性、设计新材料有着重要作用;另一方面,一个包含了材料结构、性质和计算细节信息的完整数据库对促进数据共享、节约计算资源具有重要意义。

因此,建立一个基于TiO2的光催化材料数据库可对光催化材料的制备提供重要的理论依据。本数据库是掺杂材料数据库的一个典型示范,其数据共享有利于推动光催化材料的研究发展。

1 数据采集和处理方法

本数据库包含的数据通过第一性原理计算产生,经过数据预处理,初始数据与处理后数据共同形成数据库。基本流程如图1 所示。

1.1 数据来源

锐钛矿TiO2晶体结构来自无机晶体结构数据库(The Inorganic Crystal Structure Database,ICSD),利用超晶胞方法构建2×2×1 大小的TiO2超晶胞结构。所有掺杂结构是基于TiO2超晶胞结构、利用高通量建模和筛选流程获取,为晶体学不等价结构,本数据库中包含掺杂结构的原子数掺杂浓度为2%。

所有的计算数据通过第一性原理软件VASP(Vienna Ab-initio Simulation Package)计算得到,开展的计算包括结构优化(Optimization)、静态计算(Static)、磁性计算(Magnetic)、能带结构(Band)、电子态密度(Density Of States,DOS)、介电函数(Dielectric)计算。其中,能带结构的计算采用3 种不同的交换关联:GGA,GGA+U 和Meta-GGA(MBJ)方法。对于GGA+U 计算,经过测试,+U 对掺杂结构的影响没有太明显变化,因此这里只提供了能带计算的数据,为结果分析提供定性的讨论,U 值的选取参考文献[21]。利用高通量计算技术开展计算,将输入输出文件存入文件系统;利用数据处理技术提取计算参数和目标结果数据。利用经验公式和数值计算获取部分衍生结果数据,将提取参数和结果数据一并存入结果文件,形成掺杂结构不同计算性质数据库文件。性质数据库文件可进行检索、查询和使用。

图1 单元素掺杂TiO2 光催化数据库数据采集流程示意图

1.2 数据规范

数据库提供的数据包含两部分,原始文件数据和提取信息数据。其中原始文件数据为软件对应的输入和输出文件,这些文件按照计算类型分为6 个类别,分别对应一个文件目录,每个目录下包含了以结构分子式命名的目录,包含了计算所对应的必要输入和输出结果文件。此外,原始文件还包含晶体结构信息文件,以POSCAR 格式展示。数据提取和预处理的结果按照json 格式写入以计算类型命名的文件中,通过解析该json 文件可以获取每种结构用于指定计算的计算参数、结构、性质以及软件等信息。数据库中存储的内容见表1。

表1 基于单元素掺杂的TiO2 光催化数据库存储内容

1.3 数据采集与处理

数据库中包含了2 类数据:第1 类文本数据,即计算所用的输入、输出文件和晶体结构。第2类为结构化数据,即数据预处理部分的提取结果。文件数据直接在不同计算的目录下存放,表2 展示了6 种计算类型的文本数据的采集内容,表3 以能带结构计算为例,展示结构化数据包含的内容及其采集和处理方法。

表2 文本数据采集

表3 能带结构数据内容及其采集和处理方法

2 数据样本描述

基于单元素掺杂的TiO2光催化材料数据库涵盖了参数数据、结构信息数据、软件环境数据以及性质数据,每种结构的计算文件分别存储在不同计算类型下,文件夹以化学分子式命名,提取的数据信息存储在以计算类型命名的json 文件中。文件夹存储的是计算文件信息,json 文件存储的是提取的结果信息。以Zr 掺杂TiO2结构(O32Ti15Zr)的结构优化和能带计算两类计算为例,说明文件存储的目录结构,如图2 所示。其中结构目录下存储的结构文件命名方式为POSCAR_Formula(Formula指的是结构化学分子式)。结构优化与静态计算、态密度计算、磁性计算、介电函数计算具有相同的目录结构,能带计算下包含三种不同计算方法,单独列出目录。图2 中能带计算的Data4_Band 包含的3 个目录Data4_1Band、Data4_2BandPlusU 和Data4_1BandMetaGGA,分别对应能带计算采用的3 种泛函方法 GGA、GGA+U 和 Meta-GGA。提取结果(Data8_Extraction)存储在以ExtractionDataNum_Type 命名的json 文件中(Num:2-7,Type:Optimization,Static,Band,DOS,Magnetics,Dielectric),如结构优化计算的提取结果文件为ExtractionData2_Optimization.json。图3以Ag 和Al 分别掺杂TiO2结构(AgO32Ti15、AlO32Ti15)的结构优化提取结果为例说明json 文件的格式。

图2 文件存储目录结构

图3 结构优化结果提取文件数据格式

3 数据质量控制和评估

本数据库在计算过程中,对影响计算结果的计算参数(ENCUT,SIGMA,KPOINTS)进行了严格的收敛性测试,以保证计算参数的稳定性和准确性。计算采用基于密度泛函理论的第一性原理计算软件,密度泛函理论在材料的结构稳定性、电子结构、光学、磁学等方面可以对实验结果进行很好地描述和解释,目前已经广泛应用于材料性质和结构的研究中。本数据库采用了3 种方法计算能带结构,旨在进一步减小由于低估第一性原理计算能隙对结果的影响。

4 数据价值

本数据库提供的源文件对结果进一步解析和续算等方面都具有重要作用。一方面,开展TiO2计算的研究人员通过解析计算原始文件,可以对计算结果进行解析或二次处理。另一方面,研究人员还可以下载计算文件继续开展其他计算。数据使用者也可以直接利用数据库中包含的结构文件开展其他性质的研究。此外,本数据库提供的提取信息结果文件,格式规范(json 文件),可以实现数据快速检索和提取。

本数据库中涵盖了元素周期表中几乎所有的元素,可对开展其他的计算和实验研究提供参考和理论依据。图4 中,替代Ti 原子掺杂的元素有83 种(所有阴影区域元素),替代O 原子掺杂的元素有16 种(深色阴影区域元素)。

图4 掺杂元素周期表

5 数据使用方法和建议

使用本数据库中的文件,可以直接下载,并支持VASP 软件计算格式。由于赝势的版权问题,在文件包中没有包含赝势文件,但是在提取结果数据的json 文件中包含了赝势的类型信息,可以进行查询。

使用数据库中提取的数据,通过解析json 文件,利用关键字检索的方式可以获取json 文件中的数据信息,从而将提取数据信息进行绘图等操作。由于电荷密度信息提取根据不同的需求有不同的取向,提取的结果中没有包含电荷密度信息,但是源文件中提供了包含电荷密度的文件,可以下载进行解析。结果文件json 数据提取代码的关键字见表2,以能带计算为例,提取AgO32Ti15结构Band计算的K 点和能带的能量本征值,并写入文本文件。在Data4_Band 目录下运行以下脚本即可。

致 谢

感谢材料集成计算与数据管理平台MatCloud 和中国科学院计算机网络信息中心中科先导1 号机器为计算提供机时服务。

数据作者分工职责

王宗国(1986—),女,山东省潍坊市人,博士,副研究员,研究方向为材料信息学。本文承担工作:数据库设计、数据产生和处理、数据库构建。

郭令举(1982—),男,河南省商丘市人,博士,副研究员,研究方向为计算凝聚态物理。本文承担工作:计算需求调研,数据检查。

万萌(1994—),男,湖北省襄阳市人,硕士,助理工程师,研究方向为软件架构设计。本文承担工作:计算流程实现与数据提取。

李凯(1983—),男,安徽省合肥市人,硕士,工程师,研究方向为软件系统架构设计、数据采集。本文承担工作:数据库设计与计算流程实现。

刘志威(1993—),男,河北省沧州市人,本科,在读研究生,研究方向为计算机软件与理论。本文承担工作:数据整理。

郭佳龙(1997—),男,湖南省湘潭市人,本科,在读研究生,研究方向为计算机软件与理论。本文承担工作:数据整理。

猜你喜欢

能带光催化数据库
吃东西时注意多
两步机械球磨法制备M/TiO2复合薄膜及光催化性能研究
汽车转向管柱吸能带变形研究和仿真优化
Life OR Death Decision
半导体光催化材料钨酸铋的研究进展
想你所想 不止于车
二氧化钛光催化产生超氧自由基的形态分布研究
数据库
数据库
数据库