基于pybel的在线化合物属性计算程序

在每天的裂解途径解析的时候,最后都要给出对应的化合物的结构信息,比如分子量、分子式等,每个化合物都要放到ChemDraw中去计算,然后再拷贝回来,效率低下,还比较容易出错。一直想写个在线的计算程序,输入SMILES,然后输出想要的结构性质和结构式,今天终于得空写好。思路如下:使用pybel的分子转化和属性计算功能,结合NCI的CIR和PubMed Compound,将这些综合起来,基本可以满足我们的要求。CIR的输入为SMILES,而PubMed的输入为InChiKey,所以需要用pybel将SMILES转化为InChiKey。具体代码如下: # -*- coding: utf-8 -*- import sys import string import cgi import pybel import urllib import openbabel as ob print "" print """ <!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML…

甘草黄酮的裂解(15):欧甘草素B(Hispaglabridin B)

欧甘草素B的负离子裂解途径 欧甘草素B的正离子裂解途径 还是觉得这种有放射背景的图更好看一些,一切看心情吧。今天是甘草黄酮系列的最后一个化合物欧甘草素B,比前天的欧甘草素A多一个不饱和度。负离子中最高的为B1,3+离子m/z 201,这个质荷比是不是在好多甘草黄酮中都见过?光甘草定、4'-O-甲基光甘草定、欧甘草素A等化合物中都有m/z 201,前面我们认为它是C环2,3-断裂的产物,这里是否也是通过与前面同样的途径裂解的呢?我们在此处给出的离子的元素组成与前面所画碎片的元素组成一致,即便高分辨也不能区分到底是哪一种碎片结构!我觉得最好的办法是用稳定同位素替换A环或B环原子,然后再进行质谱分析,看看生成的离子是不是比m/z 201多固定的质量。可见,仍有很多细节需要深入研究才能确定,所以我前面或者今后所画的裂解途径图,仅是在现有数据的前提下,一种可能的推测,如果有更多的数据,就可能对推测结果进行修正。我在上面的图中加了一个Bug,希望大家一起来找Bug,从错误中不断提高自己解析质谱的能力。 正离子模式的裂解也遇到了两难,m/z 189可能为A1,3+, 也可能为B2,3+,这是由于化合物本身的对称结构造成的。在欧甘草素A中,由于B环多两个氢,所以分别生成了m/z 189和191,而欧甘草素B的两个途径生成的碎片正好元素组成一样,最有可能这个m/z 189是两种离子的混合物。m/z 147在3′-羟基-4′-O-甲基光甘草定的正离子质谱图中也有观测到,当时我们认为是m/z 215进一步失去异戊烯基而生成的,而这里我们认为是m/z 189丢失丙烯基的产物,到底哪种正确呢?需要对m/z 215和189进行MS3分析,知道了离子间的母子关系,也就可以作出最终判断了。 质谱解析的难点在于,我们不知道什么时候才能收集足够的信息而获得唯一合理解,由于各种客观条件的限制,我们仅能获得关于结构的部分信息,使质谱解析变得扑朔迷离,这也正式其魅力所在吧。昨晚,一个搞计算机的同学看我画理解途径图,马上领悟了其精髓:这个与拼图或猜字游戏非常相似,貌似就是按某些特定的规则凑质量数!是呀,在别人打游戏的时候,我也在玩自己的游戏。 欧甘草素B的正负离子质谱图   ===================================================== 化合物:Hispaglabridin B 分子量:390.5 分子式:C25H26O4 SMILES: CC1(C=CC2=C(O1)C=CC(=C2O)C3CC4=C(C5=C(C=C4)OC(C=C5)(C)C)OC3)C InChIKey: CJUFYKORDZSOLF-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(14):3-羟基光甘草醇(3-hydroxy-glabrol)

3-羟基光甘草醇的正离子裂解途径 3-羟基光甘草醇的负离子裂解途径 3-羟基光甘草醇属于二氢黄酮醇,结构上仅比前面介绍的光甘草醇在3位多一个羟基,不用想也知它们的裂解途径很相似。在负离子模式下,C环开裂生成A1,3+(m/z 203),并进一步失去CO2得到m/z 159。理论上还应该看到电荷在B环的B1,3+离子(m/z 203),但它的质荷比正好与A1,3+相同,是不是我们观测到的m/z 203为这两种离子的混合物呢?这只有通过高分辨质谱去判断了,暂时不表。奇怪的是生成了m/z 221,这是在光甘草醇的质谱图中没有看到的(也有可能是作者遗漏了)。因为有以前的经验,很容易推测是四元内酯环加水的产物。这种质谱内的分子离子反应在含有羧基、内酯或裂解后可以生成这些结构的化合物中经常看到。我在硕士论文中设计了通过改变质谱环境中可能存在的不同中性分子,比如将水换成甲醇、乙醇等,就可以证明这类反应不虚。 正离子模式下,主要反应为丢失异戊烯单元(56Da),由于3-OH,可进一步脱一分子水,生成m/z 335。这种脱水反应是二氢黄酮醇的特征反应,一般黄酮内其他地方都没有这里容易脱水。我在裂解途径中喜欢把重排反应的每一步详细画出来,当然为了省事可以不画中间的过程,只画最后的产物,但这样读者就不容易看明白,知其然,不知其所以然。希望大家能明白我的苦心。今天,对裂解途径图又有些调整,中间结构间用虚箭头连接。3-羟基光甘草醇的结构中有两个异戊烯单元,究竟是那一个先掉呢?在光甘草醇的负离子裂解中,我画的是8-异戊烯基丢失,而在3-羟基光甘草醇中花的是3‘-异戊烯基丢失。那么光甘草醇有没有可能先丢失3’-异戊烯基呢?很有可能,如果有这个化合物的话,只需要对m/z 337进行MS3分析,就可以确定了。由于没有充分的数据,我只能也只有画一种可能的裂解途径。而今天的3-羟基光甘草醇有其他碎片的佐证(m/z 177, 229),只有先丢失3‘-异戊烯基才合理。 还没有从上周末的忙碌中恢复过来,显得很疲惫。突然觉得井底之蛙也是幸福的,过多的欲望才是痛苦的源头。 3-羟基光甘草醇的正负离子质谱图 ===================================================== 化合物:3-hydroxy-glabrol 分子量:408.5 分子式:C25H28O5 SMILES: C/C(C)=C/CC1=C(O)C=CC(C2C(O)C(C3=C(C(C/C=C(C)/C)=C(O)C=C3)O2)=O)=C1 InChIKey: LAQLCZKPJGMFRM-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(13):欧甘草素A(Hispaglabridin A)

欧甘草素A的负离子裂解途径 欧甘草素A的正离子裂解途径 欧甘草素A比光甘草定的母核相同,仅在3‘位多一个异戊烯基,它的正负离子质谱图的主要裂解途径与光甘草定一致,相同的裂解途径可以参考以前的文章,此处不再详述。 欧甘草素A负离子质谱图中的m/z 203是光甘草定的质谱图中没有的,推测与3‘-异戊烯有关:首先4'-OH上的氢重排到1‘-位,发生C2-C3键断裂,C-1'上的H转移到C1上;其次,B环3'-异戊烯(相当于苄位)上的氢转移到C3,2’-OH上的氢转移到C1‘;最后,C3-C4键断裂,C1'-H转移到C4,生成m/z 203。m/z 189为电荷在B环上,然后C3-C4断裂的结果。 欧甘草素A在正离子模式中,主要发生异戊烯丢失,A环1,3开裂和A环2,3开裂的反应,与光甘草定一致,具体看上面的裂解途径图。 欧甘草素的二级质谱图 今天本来是大家心情很好的一天,忙活了两天,终于可以放松一下了。只是在沙田吃甜品的时候,我们一个男同学侧身给上菜的Waiter让位时,不小心碰到了隔壁的一位像猪一样的大妈(也有可能是大叔)。我们那位同学马上说了一声“对不起”,没想到那个不知性别的、猪一样的东西竟然用粤语说“你说的什么,不要给我说普通话,给我说粤语”态度及其恶略,我们一度怀疑遇到了精神病。我们没有与它计较,但心情都被搞坏了。哎,低素质的人哪里都有呀。 ===================================================== 化合物:Hispaglabridin A 分子量:392.5 分子式:C25H28O4 SMILES: C/C(C)=C\CC1=C(O)C=CC(2CC3=C(OC2)C4=C(OC(C)(C)C=C4)C=C3)=C1O InChIKey: HZHXMXSXYQCAIG-KRWDZBQOSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(12):4′-O-甲基光甘草定(4′-O-methylglabridin)

4'-O-甲基光甘草定的负离子裂解途径 4'-O-甲基光甘草定的正离子裂解途径 新版ChemDraw终于支持元素颜色标记了,同时调整了一下线条的粗细和背景,现在看起来自我感觉很不错,非常像ChemWriter的style。4'-O-甲基光甘草定仅比昨天的化合物少了一个OH,它们的裂解途径几乎完成一样,所以今天可以偷懒了,详细解释参看昨天的文章。 4'-O-甲基光甘草定的质谱图 ===================================================== 化合物:4′-O-methylglabridin 分子量:338.4 分子式:C21H22O4 SMILES: CC1(C)C=CC2=C(C=CC3=C2OC(C4=C(O)C=C(OC)C=C4)C3)O1 InChIKey: ZZAIPFIGEGQNHP-CQSZACIVSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(11):3′-羟基-4′-O-甲基光甘草定(3′-Hydroxy-4′-O-methylglabridin)

3'-羟基-4'-O-甲基光甘草定的正离子裂解途径 3'-羟基-4'-O-甲基光甘草定的负离子裂解途径 首先对于裂解途径图中的一些默认设定再说明一下:(1)绿色背景为负离子模式,黄色背景为正离子模式;(2)质谱图中观测到的离子碎片的结构在裂解图中标注为“m/z ***”,如果结构下面没有,则表示其为裂解中间体(中括号省略了);(3)中性丢失碎片的标注为“NL: ***Da”;(4)结构上的单边箭头表示转移单电子,双边箭头表示转移一对电子;(4)不同碎片结构间的箭头指明裂解的过程,如果是双向箭头,则这两个结构是可以互变的。 今天这个化合物(3'-羟基-4'-O-甲基光甘草定,简称HMG)属于前几天介绍的光甘草定的衍生物,故有几条裂解途径与光甘草定的一致,我就不画详细的过程了,可以参看前面的文章,我主要解释与前面不同的地方。HMG的(B1,4-)比光甘草定多30Da,正好是多一个O+CH2;HMG没有看到C环2,3键断裂的碎片,这是由于B环的4'-OH被甲基化了,不能重排成稳定的甲烯酮结构(参看光甘草定的裂解);HMG的B环有两个相邻的酚羟基,它们的活泼氢可以分别重排到C-3和C-4上(裂解途径图右下角的结构),最终生成(A1,4-)离子m/z 175,同时失去178Da的非常稳定的结构。 正离子模式下,HMG生成与光甘草定相同的(A1.3+) m/z 189和(B2,3+) m/z 153,但没有看到丢失56Da的碎片,说明B环的取代对于呋喃异戊烯的断裂有很大影响。质谱图中还有少量的碎片m/z 215和147,推测它们为丢失B环,及进一步失去异戊烯单元的碎片。与一般异戊烯丢失56Da不同,这里丢失的为68Da (From m/z 215 to 147),可见这类呋喃异戊烯结构的特征并不明显,很难通过扫描特定的中性丢失把它们从混合物中检识出来。 3'-羟基-4'-O-甲基光甘草定的质谱图 ===================================================== 化合物:3'-Hydroxy-4'-O-methylglabridin 分子量:354.4 分子式:C21H22O5 SMILES: CC1(C)C=CC2=C(C=CC3=C2OC(4=C(O)C(O)=C(OC)C=C4)C3)O1 InChIKey: PPBISUGOQDBBEL-CYBMUJFWSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(10):光甘草醇(Glabrol)

光甘草醇的裂解途径 已经连续4天是光甘草某某了,虽然名字上仅差一个字,但结构上差别还是很大的,不仅是一个酮或醇的差别。光甘草醇(其实一般酚羟基不叫醇的,这个名字起的,有点那个,还不如叫光甘草酚)在A和B环上各有一个酚羟基,酸性都较强,均可丢失活泼氢而带负电荷,所以当C环发生1,3-断裂(这里也叫逆迪尔阿泽反应,RDA)后,根据电荷位点的不同,生成m/z 203和187。m/z 203进一步失去二氧化碳得到m/z 159。你可能注意到我把m/z 203画成了内酯结构,当然也可以是开环的烯酮结构,到底那个更靠谱呢?这个还真有点难度,我曾经用Gaussian计算了这两种构型哪种更稳定,结果发现与A环上连接的基团有关,正负离子模式下的也不一样。我建议啊,一般情况下,根据需要去画,比如它后面要丢失CO2了,我就画成内酯结构,如果不知道后一步反应,那就看心情吧,哪个看着顺眼画哪个。 在正离子模式下,基峰为丢失56Da的m/z 337,这是含异戊烯单元的最特征反应,我给出了一种六元环形式的断裂过程,也有可能是7-OH上的氢重排到C-8,然后发生1,3-消除反应。也有人认为是异戊烯上的双键先质子化,然后C-C键断裂,生成苄基正离子。这几种途径都有一定的合理性,从本质上它们应该是等价的,最终的产物通过分子内的电荷重排,也是一样的。光甘草醇的正离子模式的C环1,3-裂解,只看到了A1,3+离子,而没有看到B1,3+离子,为什么呢?因为B环上没有合适的基团可以稳定住正电荷,电荷主要分布在A环和C环的羰基上。A1,3+离子进一步失去2H,得到m/z 203,这是一个非常稳定的大共轭结构。 今天这个例子中,我们把著名的RDA反应也归入了我的“1,3-断裂”的范畴,还有那个麦氏重排,当然也属于"1,3-断裂"的一个特例了。是否有的重排反应,不属于“1,3-断裂”呢?我好像还没有发现,记得潘远江教授有篇文章就是讲一个重排反应,发到了JASMS上,那个学生因此收到了好几个牛校的Offer。对的,那个反应也属于“1,3-断裂”,感兴趣的可以去看一下,用“1,3-断裂”的理论去解释,比文中的解释更直接, 更容易懂一些。 光甘草醇的质谱图 ===================================================== 化合物:Glabrol 分子量:392.5 分子式:C25H28O4 SMILES: CC(=CCC1=C(C=CC(=C1)C2CC(=O)C3=C(O2)C(=C(C=C3)O)CC=C(C)C)O)C InChIKey: CUFAXDWQDQQKFF-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(9):光甘草定(Glabridin)

光甘草定负离子模式裂解途径 光甘草定正离子模式裂解途径 早晨匆忙上班,发现大街上空荡荡的,走到地铁口,看到8号风球的警报,才知道上午不用上班了。昨天七夕,各路神仙都在发表对七夕的各种看法,即便生孩子的、加班的、甚至已到中年的也不例外。而我呢,给自己点了一套大餐,美美吃一顿,然后该干啥干啥。昨晚本想出去跑步,后来没去,好吧,雨中跑步确实显得有点过分哦。 光甘草定的裂解有点复杂,在负离子模式下,我认为呋喃环会先打开,这是一个重要的中间体,然后以这个中间体开始,会发生a, b, c三条裂解途径。在a途径中,C环的4位键断裂,在3位形成双键,这是因为正好在3-位有个氢原子。然后2'-OH上的氢,通过一个6元环重排到1-O上,形成一个五元吡喃环,这就是m/z 147。在b途径中,经过一系列分子内活泼氢重排,发生1,3-断裂或2,3断裂,得到m/z 135和121。根据B环上的羟基是否先进行重排,c途径又分为d和e途径,在d途径中丢失B环,生成m/z 213;e途径也最终发生2,3键断裂,但与b途径不同的是电荷最终在A环上,获得m/z 201。这些碎片根据结构,不难猜测最终的碎片是哪一部分,原文中也有介绍,但要知道它们是怎样一步一步的生成的,就需要花点功夫,希望我的努力能让你有所收获。 在正离子模式下,主要发生C环的1,3断裂,以及丢失异戊烯特征碎片56。原文中我觉得他画的碎片离子的结构有问题,并且没有解释为什么这个环状的呋喃环可以丢失56,而前两天具有相同呋喃结构的却不能观测到丢失56的碎片。从我们上图给出的详细裂解途径(g途径)可以看出,C环的4位具有氢原子,正好在苯环的苄位,有一定酸性,它可以重排到7位,使呋喃环开还后,正好有一个氢原子转移到异戊烯基上,否则异戊烯上需要一个氢原子转移到7-O上;最后生成的碎片离子m/z 269的电荷在8-位甲基上,其正好可以被A环的共轭体系稳定,而不是原文中那种烯键带正电荷,那样是不稳定的。昨天的光甘草酮为什么没有看到丢失56Da的碎片呢,因为呋喃环上氧原子的连接苯环的对位没有alpha氢,不能实现转移一个原子到异戊烯上的反应,只能是异戊烯上的alpha氢转移到苯环的氧原子(2'-O)上,所以丢失的异戊烯碎片为54,而不是56。 今天就分析到这里,去看看台风是否停了! 光甘草定的正负离子质谱图   ===================================================== 化合物:Glabridin 分子量:324.4 分子式:C20H20O4 SMILES: CC1(C=CC2=C(O1)C=CC3=C2OCC(C3)C4=C(C=C(C=C4)O)O)C InChIKey: LBQIJVLKGVZRIW-ZDUSSCGKSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(8):光甘草酮(Glabrone)

光甘草酮的裂解途径 这类黄酮的解析真不简单,每天都要花我一个小时的时间,有点超出预期。下个系列一定选个简单点的,争取在15分钟内全部搞定。光甘草酮属于异黄酮,但C环开裂的离子丰度不高,如负离子模式中的m/z 213和正离子模式中的m/z 137,主要碎片与C环上的羰基和成环的异戊烯基有关。由于数据属于二手的,可能作者已经无意中剔除了一些丰度不高的离子,再者缺乏离子的精确质量信息,所以某些离子的类型不是非常确定,比如负离子模式中的基峰是母离子丢失44Da形成的,可能丢失的为CO2,也可以为与光甘草素(Glabrene)一样的丢失丙烷,我们推测丢失的为CO2,因为这是在黄酮中常见的C环反应。正离子模式中的主要碎片分别丢失42和54Da,这也很奇怪,为什么不是丢失56Da呢?期待有高分辨的数据来解释这些不合理的现象。 光甘草酮的二级质谱图 ===================================================== 化合物:Glabrone 分子量:336.3 分子式:C20H16O5 SMILES: CC1(C=CC2=C(O1)C=CC(=C2O)C3=COC4=C(C3=O)C=CC(=C4)O)C InChIKey: COLMVFWKLOZOOP-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(7):光甘草素(Glabrene)

光甘草素的负离子模式裂解途径 光甘草素属于异黄烷-3-烯,同时B环上有一个环合的异戊烯单元,但它没有异戊烯的特征碎片离子m/z 56或42,这与其特殊的结构有关。在原来的文章中,作者虽然号称在补充材料中给出了其裂解途径,我感觉他只是虚晃一枪而已,仅解释了这类黄酮最常见的断裂碎片,还给出了几个根本看不到的碎片的解释,不知道作者是怎样从质谱图中看到那些离子的,而另外那些非常明显的碎片离子,作者直接给无视了。正如我们前面提到的,对于这种越看似简单的结构,解析起来越发难,光甘草素最难的是,它要经过N步的分子内重排以后,才会丢失H2O、丙烷和CO。我在上图中详细画出了各步重排以后的中间结构(方括号中的结构),电子转移的箭头我就不画了。重点看m/z 277,293和303三个碎片离子,它们本身都最终形成了大共轭体系,非常漂亮。 光甘草素的(-)ESI-二级质谱图 ===================================================== 化合物:Glabrene 分子量:322.4 分子式:C20H18O4 SMILES: CC1(C=CC2=C(C=CC(=C2O1)C3=CC4=C(C=C(C=C4)O)OC3)O)C InChIKey: NGGYSPUAKQMTNP-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。