大学化学, 2019, 34(9): 125-134 doi: 10.3866/PKU.DXHX201903032

未来化学家

稀土元素配合物结构的大数据分析

谢俊忠, 杜骏豪, 何嘉炜, 胡皓然, 沈辰熹, 卞江,

Big Data Analysis of Structures of Rare-Earth Coordination Compounds

XIE Junzhong, DU Junhao, HE Jiawei, HU Haoran, SHEN Chenxi, BIAN Jiang,

通讯作者: 卞江, Email: bj@pku.edu.cn

第一联系人:

§2018级本科生

收稿日期: 2019-03-31   接受日期: 2019-05-8  

Received: 2019-03-31   Accepted: 2019-05-8  

摘要

元素化学是一门经验性较强的学科,通过描述或枚举的方法讲述元素的性质在教材和文献中随处可见。在Scifinder数据库中,每年新增数以百万计的新物质,推动着对元素化学的认识不断深入发展。在大数据和人工智能迅猛发展的今天,尽管化学工作者在长期实验工作中积累的第一手经验和直觉仍然非常宝贵,但效率已不足以满足当前材料和分子设计对分子性质的需求。数据库中的海量资源为新规律的发现提供机遇。我们用大数据的方法分析稀土配合物的结构性质:将剑桥晶体结构数据库中的稀土配合物用定量的方法进行归类,统计有关配合物结构的相关信息。通过分析样本数据与典型案例,我们得出了稀土配合物结构的普遍规律。基于我们的研究成果以及研究过程中遇到的问题,我们总结与展望了大数据在化学中的应用。

关键词: 大数据 ; 统计 ; 稀土配合物 ; 配位数 ; 配位几何结构

Abstract

Element chemistry is a highly empirical subject, and descriptive or enumerative methods depicting the nature of elements can be seen in textbooks and publications. In the Scifinder database, millions of new compounds found every year considerably enhance the understanding of element chemistry. With the rapid development of Big Data and Artificial Intelligence, the chemists' long-term experimental experience and intuition, though precious, fail to meet the demand of molecular properties for the material and molecule design in efficiency. Massive data sources in the database provides a brand-new opportunity to discover new rules. We apply big-data methods to analyze the structural properties of the rare-earth coordination compounds, by gathering statistics from the Cambridge Structural Database System and classifying the entries quantitatively. We also give the general rules by analyzing the data and some representative examples. Based on the results and the problems in research, we summarize and outlook the application of big-data in chemistry.

Keywords: Big data ; Statistics ; Rare-earth compound ; Coordination number ; Coordination geometry structure

PDF (2983KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

谢俊忠, 杜骏豪, 何嘉炜, 胡皓然, 沈辰熹, 卞江. 稀土元素配合物结构的大数据分析. 大学化学[J], 2019, 34(9): 125-134 doi:10.3866/PKU.DXHX201903032

XIE Junzhong. Big Data Analysis of Structures of Rare-Earth Coordination Compounds. University Chemistry[J], 2019, 34(9): 125-134 doi:10.3866/PKU.DXHX201903032

1 引言

被誉为“工业维生素”的稀土元素有着独特的配位化学,不同于配位模式受中心原子配位偏好支配的d区过渡金属,稀土配合物的结构更加复杂多变。不论是多种多样的配位数(从3到15),还是罕见配位几何结构的频繁出现,都反映了稀土元素配位模式的丰富性和独特性。稀土配合物结构的多样性不仅拓展了配位化合物的结构知识,也为超分子组装研究提供了更多选择[1]。另一方面,更加“柔性”的配位层也为中心原子配位环境的设计创造了充足的空间。然而,由于对稀土元素配位结构规律的总结较少,目前仍缺少定向设计与合成的策略,因此稀土元素化合物丰富的材料功能和可观的应用前景使得相关结构规律的总结显得尤为迫切。

过去,人们对于配合物结构规律的认识多源于典型化合物的枚举,大数据(Big Data)概念的出现,为研究复杂分子体系开辟了一条新的道路。充分、有效地运用化学大数据可使化学工作者更快速、更高效地总结归纳前人积累的实验结果,为进一步的发现和创新奠定扎实的基础。在众多化学数据来源之中,表达最清晰、可信度最高的莫过于晶体结构数据。1997年,Jeffrey S. Moore等[2]基于无机晶体结构数据库(ICSD)制作了d区过渡金属配位结构规律表,其中包括对中心原子电荷和配位数的统计结果。然而原文中并没有对统计结果做出进一步的解释,也未说明统计学方法应用于配位化学的合理性与局限性。针对于某一族元素配合物的结构分析[3]也有开展,但稀土元素的相关研究仍然较少。

在过去20年里,晶体结构数据库的规模迅速扩大,进一步提升了利用大数据研究配合物结构规律的可行性和可靠性。在本文中,我们利用有机小分子和金属有机配合物结构数据库(The Cambridge Structural Database System,以下简写为CSD)对稀土元素的配位环境进行了大数据分析,给出了稀土配合物的配位数和几何结构的初步统计规律,并依据其中典型实例,探讨了影响稀土元素配位模式的主要因素。

2 研究方法

CSD收录了世界范围内已认可的超过98万种有机及金属有机化合物晶体结构。我们使用CSD客户端的ConQuest软件(2.0.0版本),分别检出统计配位数为6至12的非聚合型、不含π配体的稀土配合物。由于配位数低于6或高于12的配合物数量较少,不具代表性,因此在本工作中没有涉及。为保证样本数据的可靠性,本工作仅统计了高精度(R因子≤ 0.05)、非高聚物的晶体结构数据,并去除了样本中的重复数据。

在得到检索结果后,从样本中导出中心离子及价态信息。利用ConQuest软件提取简单配体、螯合配体、混合配体的个数和配位数、中心原子个数等信息。

空间构型的判定以及配位原子的检索是用CSD Python API软件进行的。利用自编python程序从数据库中提取键角数据,将与中心原子直接键连的原子进行计数,统计出配位原子的种类和数目;将配位键两两之间的键角与特定配位数下标准空间构型的键角(参见SI表1)相比较,根据如下公式算出标准差δ,进而对空间构型进行定量分析:

将化合物的所有键角由大到小排列,分别记为θ1θn,其中,n =N × (N- 1) ÷ 2是配位数为N时键角的数量。同时,该配位数下的标准构型键角也将由大到小排列,分别记为Θ1Θnδ值越小越接近标准构型[2],比较各种构型对应的标准差之间的大小即可判断该配合物的空间构型。部分配合物的几个构型δ值之间相差不大,无法确定该配合物的构型;还有部分化合物的δ值都很大,以上两种情况都表明该配合物的构型介于两种或几种空间构型之间。由于稀土配合物偏离理想构型的情况比较普遍,我们根据各种空间构型之间的标准差作为理想样本的筛选原则。

获取全部所需信息之后,我们对各参数分别进行抽样检查,准确率在95%以上,确保了后续工作的可靠性。

3 研究结果

3.1 配位数

符合筛选标准的稀土配合物共有14380个。表1-3是给定价态下配位数的分布情况,其中正三价稀土离子的配合物有14036个,占总数的97.61%,正三价是稀土元素配合物的最主要价态。

表1   二价稀土元素配位数的分布情况

元素配合物个数
6配位7配位8配位9配位10配位11配位12配位
Sm296126100
Eu2011217404
Yb6421289300

新窗口打开| 下载CSV


表2   三价稀土元素配位数的分布情况

元素配合物个数
6配位7配位8配位9配位10配位11配位12配位
Sc101305131002
Y2151222661891924
La74671713241824753
Ce101742272051062329
Pr0311221881091424
Nd10982443621632324
Sm13211627927287811
Eu707347148214465
Gd5266495451128315
Tb38784513848738
Dy691108194637028
Ho24462571552904
Er81843771894503
Tm272089591502
Yb2421633552203111
Lu113771861231001

新窗口打开| 下载CSV


表3   四价稀土元素配位数的分布情况

元素配合物个数
6配位7配位8配位9配位10配位11配位12配位
Ce201310001

新窗口打开| 下载CSV


对照SI表3中稀土离子在不同配位数下的Shannon半径,分析配位数峰值以及整体分布不难发现:半径是影响稀土配合物配位数的主导因素:

(1)无4f电子的Sc3+、Y3+、La3+随半径增加,配位数峰值从6上升到9,通过更多的配键补偿配体之间的斥力[4]

(2)正三价镧系离子中,主要以8配位和9配位为主。La、Ce、Pr、Nd主要为9配位,Sm、Eu、Gd的8配位与9配位数量相当,Tb、Dy、Ho、Er、Tm、Yb、Lu则是8配位占优势。配位数大于九的高配位数化合物数量,从La到Lu有明显的递减趋势,犹以11、12配位最为典型,其化合物中心原子主要为轻镧系元素La、Ce、Pr、Nd。

(3)配位数小于8的配合物所占百分比却随着原子序数上升而增多,Yb、Lu甚至在6配位处形成第二个峰。

总体上,配位数随着原子序数的增加,离子半径减小,从高配位数向低配位数移动。

4f轨道成键的惰性[5]使得电子排布的差异对于配位数的影响微乎其微,计算研究[6]表明,镧系元素与配体之间的作用是带有共价成分的离子键或离子-偶极相互作用,这一定程度上削弱了共价键的饱和性与方向性,空间因素——中心离子的半径主要影响了配位数的分布。这也解释了表中不同镧系元素之间配位数分布差异不大的现象。

对于其他价态,正四价离子仅有Ce4+的化合物得到了有统计意义的样本数目,同样以8配位与9配位为主,其中以8配位的化合物数目最多,这与Ce4+的半径远小于Ce3+、La3+的事实相一致(参见SI表3)。正二价离子中Sm2+、Eu2+、Yb2+具有可观数目的配合物,相比于对应的正三价离子,配位数明显向低配位数偏移,以6配位为主。这反映了随中心原子电荷降低,配位键共价性增强,配位能力下降。

3.2 配位多面体

根据之前提到的算法,我们对配位数从6到10的所有稀土单核配合物进行计算分析。由于部分样本没有键角信息或键角信息不适用于给出的算法,共得到5259例。对每一个配合物选取δ值最小的多面体作为它的近似的配位多面体。考虑到理想的多面体数量较少,扭转存在于大多数配合物之中,且有一部分扭转十分严重以至于其几何结构介于两种多面体之间,故引入参数α

其中,α用来衡量把一个化合物归作对应的多面体的可信度。

δ1对应的多面体为基准计算其他多面体得标准差值,取其中的最小值δmin (参见SI表2.1-2.5)。选取满足δ1 < δmin并且α > 0.15的正三价稀土配合物作为理想样本,对各配位数下的空间构型作出折线图,结果如图1所示。

图1

图1   各空间构型的配合物数量随元素种类的分布


图1可知,稀土元素之间对于配位多面体之间的偏好没有明显的差异。配位数为6时主要采取正八面体与三棱柱构型,其中正八面体具有优势;配位数为7时则以单冠三棱柱与五角双锥为主,其中五角双锥构型数目更多。配位数为8时,以四方反棱柱与十二面体为主,前者稍占优势;在九配位配合物中,单冠四方反棱柱数量最多,三冠三棱柱构型与另一不常见构型Muffin (图2)也有可观数目的化合物。十配位的配合物最倾向于双冠十二面体(图3)构型,该构型占总样本数的85.61%。

图2

图2   九配位Muffin结构


图3

图3   十配位双冠十二面体结构


随着配位数上升,配合物因配位层拥挤而导致的扭转使得理想样本数量骤减,本文所用算法在配位数为11和12的配合物中的构型分类能力有限,故未进行分析。

为探究中心原子倾向采取的配位多面体,我们选取配体全为单齿的配合物,绘制图4所示的饼状图。对比于折线图,在配位数为6、7时,八面体构型与五角双锥构型分别成为具有绝对优势的配位多面体。其中三棱柱构型与单冠三棱柱构型的物种或者普遍具有庞大的配体,抑或有较小的中心原子(如Sc3+)。一般而言,这两种构型的能量较高,但相比于正八面体与五角双锥构型,它们具有更好的容纳大位阻配体的能力。

图4

图4   无鳌环配合物在各构型中的数量分布

(a)六配位;(b)七配位;(c)八配位;(d)九配位


随配位数升高不同配位多面体之间能量已非常相近,仅需克服很小的势垒即可发生构型转换[7]。配位数为8时,十二面体与四方反棱柱物种占比没有明显变化,配位数为9时Muffin构型的配合物数量骤减,单冠四方反棱柱与三冠三棱柱构型数量占主要。配位数大于9时,已经没有仅含单齿配体的配合物,这反映了螯合配体在稳定高配位数配合物中的重要作用。

3.3 螯环

图5是配位数与螯环相关性的折线图,选取了全部样本进行统计。随配位数升高,具有多个螯环的配合物占比逐渐升高。在配位数大于等于10时,配合物普遍有两个及以上的四元以内的螯环,且其中绝大多数(72.1%)配合物含有两个及以上的硝酸根。

图5

图5   多鳌环配合物的数量百分比随配位数的变化趋势


表4选取了理想的样本,统计分析配位多面体与螯环之间的关系。对比正八面体与三棱柱构型,三棱柱构型含有螯环配合物占比明显更多。同样配位数为7时,单冠三棱柱构型含有螯环的物种也明显多于五角双锥构型,五角双锥构型因拥挤的赤道平面以及轴向与赤道方向较远的距离而显然不适合容纳较多的螯环。

表4   理想样本中各空间构型含有≥ 2个螯环的配合物占所有构型配合物的百分比

配位数空间构型百分比/%
6八面体29.53
三棱柱86.38
7五角双锥32.36
单冠三棱柱82.59
8四方反棱柱68.69
十二面体73.65
9三冠三棱柱56.52
单冠四方反棱柱83.93
Muffin98.23

新窗口打开| 下载CSV


图1a中,不常见的Muffin构型出人意料地占有相当大的比重,这种构型因对称性较低且具有拥挤的五元环平面而不够稳定,但是在五元环平面内配位键之间的夹角却十分适合容纳四元螯环。

Muffin构型在稀土配合物中是一种常见的配位模式,其中由两个硝酸根配体构成五元环平面的4个顶点。由此可见,螯合配体尤其是倾向于形成小环的螯合配体一定程度上丰富了稀土配合物的配位模式。

3.4 配体与配位原子

图6是配位原子分布饼状图,作为硬酸,稀土离子亲氧,因而使氧原子在所有配位原子中具有压倒性的数量优势。其次,以氯和氮作为配位原子也具有一定比例,而较软的磷、硫原子则较少。含氧的硝酸根、β-二酮配体是最为常见的若干配体中的两个,分别有2774、1377例。此外,双齿羧酸根、邻苯二酚衍生物作为配体也很常见。与氧相比,氮原子作为配原子的实例相对较少,其中Schiff碱873例、邻二氮菲760例和乙二胺及其衍生物634例。螯合配体稳定了这些以氮原子配位的稀土配合物。

图6

图6   所有配合物的配原子分布饼状图


4 讨论

稀土配合物的配位数受到空间因素如中心离子的半径、配体的位阻以及鳌环的尺寸的影响。稀土-配体键中较弱的共价性使得稀土配合物可以在一定范围内承受配体的种类、大小与位置的变化而不发生显著的结构转变[8];随着配位数的升高,稀土配合物在几种常见配位多面体之间的转换变得容易(如单冠四方反棱柱与三冠三棱柱,相互之间的δ值均小于0.1),这种结构“柔性”使得高配位数稀土配合物的空间结构变得难以预测,配位环境轻微变化也可能导致构型转化。通过比较结构类似的化合物,分析结构与理想构型接近的样本,可以初步总结出一些影响稀土配合物配位几何结构的因素。

4.1 中心离子半径

在配体相同或相近时,中心离子的半径差异可能会影响配位多面体的选取。一方面半径的变化可能会改变双齿配合物与中心离子的键角。在分析含有三个六元螯环的六配位化合物时发现,三乙酰丙酮合钪(Ⅲ)采取八面体构型,三乙酰丙酮合镱(Ⅲ) (FEBGAU)则是三棱柱构型(以下配合物均使用CSD数据库中的ID命名,读者可以自行通过https://www.ccdc.cam.ac.uk/structures/检索配合物的3D结构,图7图8图9为配合物的示意图)。乙酰丙酮配体两个氧原子的距离为0.27 nm,可以勉强跨过Sc八面体的一条棱,Yb半径更大只能形成76°的夹角,三棱柱构型更加适合。在六元鳌环中用若干第三周期原子取代部分环内原子,增加双齿配体中两个配位原子之间的距离,又使得正八面体更有利。

图7

图7   表现中心离子半径对结构影响的配合物结构图


图8

图8   表现配体间相互作用的配合物结构图


图9

图9   表现晶体中其他组分的影响的配合物结构图


另一方面,中心离子半径的变化也会影响配体之间的作用(图7)。我们筛选出含有两个环状四齿配体酞菁的八配位配合物,当中心原子为La、Ce (QOCJIB)时,配合物采取重叠式构象,为立方体构型。而当Y以及Gd、Dy(HEGJAH)、Tb作为中心原子时,则采取交错式构象,呈四方反棱柱构型。上下配体之间的π-π作用决定了配合物构型的选取,这两种作用力都与两个酞菁环之间的距离有关,随金属半径增大,环间距线性增大,π-π作用削弱,扭转角减小[9],立方体构型更加有利。同时也有观点认为两种构型能量十分接近,多种因素都能影响构型,其中晶体对称性是最重要的[10]

4.2 配体之间的相互作用

配体之间斥力也是配位化合物空间结构选择的决定因素之一,含有大空阻的配体通过各庞大基团之间的相互协同,寻找到斥力最小的位置,有时会形成具有一定对称性的不常见构型多面体(图8),如三棱柱构型的KERSIM。不同多面体之间容纳大体积配体的能力也有所不同,大基团的出现会使配合物趋向于某种构型,如前文提到的三棱柱构型与单冠三棱柱构型。含有多齿配体的配合物中,鳌环的刚性也能决定配位几何结构,如八配位的六角双锥构型普遍含有冠醚等环状六齿配体。

除了大基团之间的斥力以外,其他特殊配体的特殊相互作用也能影响配合物的空间构型。五角双锥构型的UDISIJ,具有7个含有芳香基团的配体,在五元环平面上,芳环之间平行排列形成的π-π作用使得五角双锥构型更加有利。水配体是体积较小的配体,稀土水合物是探究中心原子配位偏好的理想样本,在八配位水合物中,十二面体构型与四方反棱柱构型有着相近的数量。二者能量十分接近,对配位环境因素也十分敏感,配位环境轻微变化可以改变构型。在含有7个水的配合物JODVOO中,磺酸基与配体水之间产生氢键作用,诱导水配体至磺酸基所在的方向,使得四方反棱柱构型更加有利。

4.3 晶体中其他组分的影响

稀土配合物分子或离子所处的环境也会影响配合物的结构,如平衡电荷的碱金属或碱土金属,以及晶格中的溶剂分子等均有可能与配合物的某些基团产生相互作用(图9)。OYECOL晶格中的冠醚与配体水通过氢键相互作用,在所处方向上产生了较大位阻,形成了单冠三棱柱构型。含有4个β-二酮的稀土配合物采取十二面体构型或四方反棱柱构型。在样本中有多个含四(1, 3-二苯基-1, 3-丙二酮)合铕(Ⅲ)离子的化合物,平衡电荷的阳离子不同,与配合物阴离子作用的方式存在差异而使得构型不同。FIDNIP中三乙胺正离子体积较小且靠近其中一个配体,对于结构整体影响不大,采取四方反棱柱构型;DAPZEC的大位阻铵正离子与四方反棱柱四边形平面一条棱上两边的氧原子存在氢键作用,而GOKWUA中体积较小的Na+吸引了四边形对角线的两个氧原子而没有和两个大平面配体产生较大斥力,这拉近了两个β-二酮的距离,此时十二面体构型更加有利;XIWTUS中1, 3-噁唑正离子与苯环存在π-π作用,使得配体扭转为非平面结构而采取十二面体构型。

总而言之,稀土配合物结构的“柔性”、高配位数配位多面体之间易于相互转化都使得稀土配合物结构不易确定。在合成中除了要选择中心离子与配体,还要筛选溶剂与平衡电荷的离子,在某些特定情况下也许还要使用模板剂或外延生长等技术。

5 结论

我们通过对CSD晶体结构数据库中的稀土配合物进行统计归纳与分析,初步揭示了稀土元素配合物的配位数、配位结构的一般规律:

(1) Sc3+、Y3+、La3+半径依次增大,配合物的配位数总体向高配位移动。

(2)镧系元素离子配位数的主要差异源于半径。相对于d区中过渡元素的d轨道在配位键形成中的普遍参与,镧系元素的f轨道则显得更为惰性,因此对配位数的主要影响因素是镧系收缩引起的半径上的变化,半径较大的轻镧系元素相对于重镧系元素配位数整体上较高。

(3)特定配位数下,稀土元素有着较为倾向的一种或两种主要的配位几何结构,由于稀土配合物结构变形较为普遍,有时理想多面体并不是描述配合物几何结构的最佳方式。

(4)稀土配合物结构的倾向很大程度取决于配位的环境:配体的齿数、形成的螯环大小、配体基团的位阻、配体之间的其他作用力都可以在其中发挥作用。配离子所处的环境可以使某一种配位结构更加有利。

我们的尝试表明将统计方法应用于化学问题的探索是有益的:通过搜集高可信度的数据,选取合适的分类标准,经数据可视化、相关性分析并且结合相关案例分析得出合理的结论。

我们的工作只探讨了较为宏观的规律,如配位数和配位多面体的结构倾向,对于更精细的结构-性质关系仍有待进一步的深入探索。我们相信,对大量已知可靠的结构数据进行详细分析,并与理论化学方法相结合,将为有关领域的研究探索注入新的活力。

致谢:感谢CSD的数据与技术支持。感谢北京大学图书馆的文献支持。

补充材料:可通过链接http://www.dxhx.pku.edu.cn免费下载。

参考文献

Hill R. J. ; Long D. ; Hubberstey P. ; Schröder M. ; Champness N. R. J. Solid State Chem. 2005, 178 (8), 2414.

DOI:10.1016/j.jssc.2005.05.008      [本文引用: 1]

Venkataraman D. ; Du Y. ; Wilson S. R. ; Hirsch K. A. ; Zhang P. ; Moore J. S. J. Chem. Edu. 1997, 74 (8), 915.

DOI:10.1021/ed074p915      [本文引用: 2]

Carvajal M. A. ; Novoa J. J. ; Alvarez S. J. Am. Chem. Soc. 2004, 126 (5), 1465.

DOI:10.1021/ja038416a      [本文引用: 1]

Buenzli J. C. G. ; Metabanzoulou J. P. ; Froidevaux P. ; Jin L. Inorg. Chem. 1990, 29 (19), 3875.

DOI:10.1021/ic00344a044      [本文引用: 1]

Li L. M. ; Ren J. Q. ; Xu G. X. ; Wang X. Z. Int. J. Quantum Chem. 1983, 23 (4), 1305.

DOI:10.1002/qua.560230419      [本文引用: 1]

Culberson J. C. ; Knappe P. ; Rösch N. ; Zerner M. C. Theor. Chim. Acta 1987, 71 (1), 21.

DOI:10.1007/BF00538479      [本文引用: 1]

Ruiz-Martínez A. ; Casanova D. ; Alvarez S. Chem-Eur. J. 2008, 14 (4), 1291.

DOI:10.1002/chem.200701137      [本文引用: 1]

Lin J. ; Diefenbach K. ; Kikugawa N. ; Baumbach R. E. ; Albrecht-Schmitt T. E. Inorg. Chem. 2014, 53 (16), 8555.

DOI:10.1021/ic501163x      [本文引用: 1]

Koike N. ; Uekusa H. ; Ohashi Y. ; Harnoode C. ; Kitamura F. ; Ohsaka T. ; Tokuda K. Inorg. Chem. 1996, 35 (20), 5798.

DOI:10.1021/ic960158d      [本文引用: 1]

Hückstädt H. ; Tutaß A. ; Göldner M. ; Cornelissen U. ; Homborg H. Z. Anorg. Allg. Chem. 2001, 627 (3), 485.

[本文引用: 1]

/