甘草黄酮的裂解(6):芒柄花素(Formononetin)

  芒柄花素的裂解途径 今天把裂解途径的图稍微美化了一下,看起来更舒服一些,负离子模式的裂解用绿色背景,正离子模式的裂解用黄色背景。芒柄花素属于异黄酮,结构很稳定,需要较高的能量才可以碎裂。这个化合物早在20多年前人们就开始研究其裂解规律了,参看Antignac的文章。不同的质谱仪和能量获得的质谱图有很大差异,现阶段基本仍需要人工去分析特定的数据,没有办法像EI-MS那样建一个标准品的谱库,然后检索比对即可得到结果。你可以比较一下下面来自不同文献的质谱数据,直观体验一下差别。上图给出了主要碎片的裂解途径,更详细的碎片分析,可以参看Antignac的文章。 文章的化合物信息部分做了一些小改动,点击化合物的SMILES查看结构,点击InChIKey查看3D结构,这主要归功于NCI/CADD Group的工作。 芒柄花素负离子模式二级质谱图(From 10.1002/rcm.1052) 芒柄花素的正负离子模式质谱图(From 10.1002/rcm.4215) ===================================================== 化合物:Formononetin 分子量:268.3 分子式:C16H12O4 SMILES: COC1=CC=C(C2=COC3=C(C=CC(O)=C3)C2=O)C=C1 InChIKey: HKQYGTCOTHHOMP-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(5):甘草酸(Glycyrrhizic Acid)

甘草酸的裂解途径 甘草酸虽不属于黄酮,但它是甘草中一个很重要的成分,我们顺便也分析下它的裂解途径。甘草酸的结构中有一个双葡萄糖醛酸,酸性较强,在负离子模式下,负电荷主要分布在与干草次酸相连的葡萄糖醛酸的羧基上,丢失甘草次酸,形成基峰m/z 351;此外,也可以丢失一分子脱水葡萄糖醛酸或葡萄糖醛酸脱水、开环,形成负离子质谱图中丰度比较低的碎片离子。在正离子模式,电荷在甘草次酸的11-位羰基上,丢失脱水的双葡萄糖醛酸得到m/z 471。由于这个3-位的糖苷键,在糖和苷元两侧都有alpha-氢原子,所以除了m/z 471,还可以丢失双葡萄糖醛酸形成m/z 453。m/z 647为丢失一分子脱水葡萄糖醛酸的碎片,裂解途径与负离子模式中的结构完全一样。 甘草酸的正负离子质谱图 ===================================================== 化合物:Glycyrrhizic Acid 分子量:822.9 分子式:C42H62O16 SMILES: CC1(C2CCC3(C(C2(CCC1OC4C(C(C(C(O4)C(=O)O)O)O)OC5C(C(C(C(O5)C(=O)O)O)O)O)C)C(=O)C=C6C3(CCC7(C6CC(CC7)(C)C(=O)O)C)C)C)C InChIKey: LPLVUJXQOOQHMX-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(4):甘草查儿酮B(Licochalcone B)

甘草查儿酮B的裂解途径 今天这个化合物属于查儿酮,仅一个苷元,没有连接糖,看似简单,其实非常复杂,越是这种结构比较单一的,可能解析起来越难。A环上与查儿酮羰基相邻的碳原子上没有羟基,它不能互变成二氢黄酮,所以主要发生与烯键(alpha-,beta-碳原子)相邻的位置的断裂,如负离子模式中的m/z 191和150,正离子模式中的m/z 121, 147, 167和193。此外,负离子质谱图中,最高的为丢失甲基自由基厚的碎片m/z 270。以上这些碎片都比较容易归属,最难的是负离子中的m/z 253和正离子中的m/z 245。负离子质谱中的m/z 253,为丢失32Da的碎片,推测丢失一分子甲醇,也就是可能与B环上的甲氧基有关。在上图的左侧我给出了可能的裂解途径:B环上3',4'-OH烯醇互变为酮式,这时在甲氧基的邻位出现一个sp3杂化的碳原子,其上的氢可与甲氧基一起消除,得到m/z 253。这个途径是我想了2天才推测出来的,不知还有没有更好的解释。正离子模式中的m/z 245为基峰,我推测其裂解过程见上图的右侧:4‘-OH上的氢重排到alpha-碳原子上,然后发生1,3-断裂,失去C2H2O,然后两侧基团连起来形成m/z 245。碎片m/z 245为两个苯环形成的大共轭体系,非常稳定,故其为基峰。 总算把这个化合物解析完毕,心里舒服多了。几个小时前,自己被Mac中的ChemDraw折麽的要发疯了,老是无缘无故自动退出,画了一半的工作丢失了好几次,又换了JSDraw, Markvin,但总没有ChemDraw用的顺手,最后不得不重新回到windows去完成剩余的工作。ChemDraw画的结构不能自动对杂原子标记颜色,只能手工一个一个选择杂原子,然后设定颜色,显得有点笨笨。为了好看,忍了! 甘草查儿酮B的正负离子质谱图   ===================================================== 化合物:Licochalcone B 分子量:286.3 分子式:C16H14O5 SMILES: O=C(/C=C/C1=CC=C(O)C(O)=C1OC)C2=CC=C(O)C=C2 InChIKey: DRDRYGIIYOPBBZ-XBXARRHUSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(3):甘草苷(Liquiritin)

甘草苷的裂解途径 甘草苷在正负离子模式下均发生糖苷键断裂,断裂的类型和丢失的中性碎片完全一样,见上图。这种断裂方式在ESI质谱中最常见,我在硕士论文中将这类反应称为“1,3-断裂”,即发生断裂的键为第1个(起始端)和第3个根键(末端),同时两端的基团连接起来,中间的第2根键形成双键(形成一个新键)。当第2根键中间插入n个双键以后,这个规律仍然成立,只是变成"1,2n+1-断裂"(n=1,2,3...)。只要起始段和末端的基团丢去以后,中间可以形成稳定的共轭体系,那这样的反应就容易发生,并且起始端和末端的键在空间上并不需要靠近,它们仍可以形成连接以后的产物,参见我以前写的“奇怪的远距离重排”。 昨天我提到没有看到甘草素断裂的碎片,我想可能是因为我们的质谱图来自文献的表格数据,而不是实测的质谱图,作者给出的有可能仅是主要的碎片,一些丰度较低的碎片就被忽略了。 甘草苷的质谱图   ===================================================== 化合物:Liquiritin 分子量:418.4 分子式:C21H11O09 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(O)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: DEMKZLAVQYISIA-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(2):7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

化合物2的正负离子质谱图 今天化合物的正负离子质谱图与昨天的第一个化合物非常接近,只是离子的丰度有些差别,它们为一对同分异构体。我感觉比较奇怪的是,这两个化合物都没有看到C环开裂的产物,难道是仪器或碰撞能量的缘故?若C环开环形成查儿酮,那么其稳定性自然会有较大提高,看不到母核碎片倒可以理解。 化合物2的裂解途径 今晚状态不佳,应该早点睡的。想起几件拖了很久的事,头痛呀,至少这周搞定一件吧。看到DXY有人讨论严新气功与哈佛医学院刚合作发表的文章,某些人像打了鸡血一样,这使我想起了春风得意的孔乙己,哎,都是可怜人呐!不说他们了,按照罗胖的说法,见了狗屎还是绕着走好,不要非去证明它怎么样,它根本就不需要去关注。 ===================================================== 化合物:7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (2) 分子量:550.5 分子式:C26H30O13 SMILES: O=C1C(C=CC(OC2C(OC3C(O)C(CO)(O)CO3)C(O)C(O)C(CO)O2)=C4)=C4OC(C5=CC=C(O)C=C5)C1 InChIKey:NLALNSGFXCKLLY-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

非线性拟合的一个前提条件:观测变量等方差分布

当我想好这个题目的时候,我顺便放狗搜了一下,找到几个非常对我胃口的博客(数据科学与R语言,Yihui Xie)。在看其中文档的过程中,我曾有短暂的失落感,“我在统计方面的知识太逊了”,不过我马上意识到自己又陷入了完美主义的坑,一个人怎能那方面都那么出色呢?在统计领域,我只要知道有哪些流行技术,哪些对我现在的研究课题有帮助,或者将来有帮助即可,只要分类整理入自己的笔记即可,完全可以等到需要的时候再去学。我自己喜欢的专业才是最根本的,这个是核心,其他只是点缀而已。我的目标是,“比药学家懂统计,比统计学家懂药学”! 为什么会想写这个题目呢?因为今天做酶动力学的模拟实验的时候,确实发现了这种现象,只有观测变量(因变量)的误差的方差恒定时,用非线性拟合得到的参数才是无偏的。对于线性拟合,只有满足高斯--马尔科夫定理条件时(零均值、等方差、不相关),最小二乘估计才是无偏估计。应该这对非线性拟合,同样适用吧。如果观测变量的误差不满足高-马条件时(比如方差随观测变量的增大而增大,可以从残差图上看到),该如何进行无偏估计呢?其实前几天已经提到了,正是Phoenix中的可进行群体药动学分析的PML!其所采用的技术为非线性混合效应模型法,广泛用于群体药动学参数的估计,模型中包含固定效应(相当于传统的非线性模型部分)、随机效应(个体间的变异)和误差模型(这里可以针对不同类型的误差进行建模,关键所在)。下面给出一个模拟实例,来说明用NLME进行非等方差时的参数估计。 模拟数据用EnzySolver的模拟功能来实现,具体参数如下: EnzySolver模拟数据,误差方差随浓度的增加而增加 模拟后的数据和误差分布如下: 用EnzySolver自带的非线性拟合功能,求得的参数为,与理论值有较大偏差,尤其是Km偏差快到10%了。将模拟的数据带入phoenix的PML模型,先假定误差模型为CObs=C+CEps (CObs观测值,C真实值,CEps误差项),拟合结果如下: 如上所求参数确有很大偏差,并且残差分布趋势随着浓度的增加而增大,这也提示所选择的误差模型不合适。将误差模型改为CObs=C+C*CEps,拟合结果如下: 可见,在我们选择了合适的误差模型以后,所求算的Km和Vm与理论值就非常接近了,且所估计的方差0.013与理论方差0.02相当接近。 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

甘草黄酮的裂解(1):4‘-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

4’-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的裂解途径 从今天起,我们将介绍一系列甘草黄酮的裂解途径。甘草黄酮的主要类型有二氢黄酮、查儿酮、异黄酮和二氢异黄酮等,今天第一个化合物属于二氢黄酮,为甘草苷的葡萄糖的二位上又连了一个洋芹糖,不知道这样的双糖是否有个名字。下图为其在负离子和正离子模式下的二级质谱图,文献中只给出了离子强度和丰度,我们用自己编写的applet控件画出了质谱图,以便直观的查看。在负离子模式下,主要为甘草素的-离子和丢失120Da的碎片离子m/z 429。丢失120Da是1-2连接的双糖的特征,在我们以前发表的文章中曾经用高分辨质谱证明过,120Da来自于糖断裂,而不是C环RDA裂解。m/z 429进一步失去洋芹糖(132Da),得到m/z 297。此外,直接丢失洋芹糖的碎片离子m/z 417丰度很低,仅为4%,说明在负离子模式下,1-2连接双糖的葡萄糖更容易发生分子内断裂。在正离子模式下,丢失洋芹糖的碎片离子m/z 419丰度较高,丢失双糖的m/z 257为基峰。正离子模式下相当于酸性环境,可认为更有利于这些糖苷键的断裂。   4‘-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的正负离子二级质谱图 ===================================================== 化合物:4’-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (1) 分子量:550.5 分子式:C26H30O13 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(OC5C(O)C(CO)(O)CO5)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: FTVKHUHJWDMWIR-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

酶动力学的PML模型

群体的加权残差与观测浓度的分布 前面我们用Excel和Matlab实现了酶动力学的参数估算方法,今天我们介绍使用药动建模工具phoenix来进行酶动力学分析。正如我们前面提到的,phoenix不支持隐式方程的求参,所以需要对数据进行一下变通,通过观察IMM方程,我们发现,虽然C0和C1之间不能用显示方程表示,但是C1和t之间的关系却可以写成显示方程,一系列的C1和对应的反应时间t我们都知道,C0可以类比于PK中的给药剂量。这种处理方式类似群体PK,每个个体在t时间采一个点,存在大量个体,每个个体的给药剂量不同,这种稀疏的数据只能用群体的模型去估计。为了实现群体PK,这就需要用到PML,即Phoenix Model Language。PML是借鉴了C++,S-Plus中的一些规范的用于Phoenix平台的建模语言,可进行非线性混合效应(NLME)分析。NLME背后的原理理解起来有点困难,但我们作为药学人士,没必要搞懂其具体的原理,只要我们会用这门语言编写满足我们要求的模型代码即可。我的原则是,够用即可,多了不学。PML支持微分方程和显示方程,C1与t的关系用微分方程表示更简单,其实就是最常见的米曼方程: dC/dt=-Vm*C/(Km+C) EnzymeKinetics(){ //米曼方程 deriv(C = - Vm*C/(Km + C)) //dose的位置,即初始浓度是加在C这个变量上 dosepoint(C) //误差模型,一般是additive,看看残差分布是否随机,如果不随机,可以用multiplictive等其他误差模型 error(CEps = 1) observe(CObs = C + CEps) //CObs是观测值,这个不能变,其等于C加误差 /*结构参数,这个主要是用来考虑个体之间的波动,其认为存在一个群体的值,即tvVm和tvKm,而对于每个个体来说,它们又有自己特定的值*/ stparm(Vm = (tvVm) *…

隐式方程的matlab实现:酶动力学(Integrated Michaelis-Menten Equation)的无偏参数求解

神奇而强大的计算分析平台 Google搜索了一下,发现隐式方程的求参问题有不少解决方案,matlab, R都可以实现。基本思路与我用Excel求参的方法一样,先编写一个函数来实现隐式方程的显示化,matlab中要用到fzero或fsolve(Excel中用的是单变量求解插件),然后再用非线性求解函数进行参数拟合。下面是积分后的米曼方程(IMM)的matlab求参代码: 先构造IMM函数: function y=IMM(p,x) %输入参数 Vm=p(1); Km=p(2); y=zeros(size(x)); NN=length(x); %不输出提示 opt = optimset('display','off'); for i=1:NN %就是用这个方程来求出某个x(i)下的解,y的初值设定为x(i)*0.9 y(i)=fzero(@(y) x(i) -y-Vm*15+Km*log(x(i)/y), x(i)*0.9, opt); end end 上面的函数写好后,保存,最后只要用下面一行命令就可以求解参数了: X=lsqcurvefit(@(params, xdata) IMM(params, xdata),...…

酶动力学数据分析工具:EnzySolver 1.0

EnzySolver 1.0界面 前段时间进行体内外相关性建模,遇到需用体外酶动力学参数预测体内的消除程度,在与做试验的同学讨论的时候,发现大家应用米曼方程并不注意前提条件,比如需控制反应时间或起始浓度,使反应结束时,底物的消除不要超过10%,否则计算的反应速率就与真正的起始速率有很大偏差,用这样获得的有偏差的起始速率与起始浓度求算Km和Vmax,必定难以获得真实的酶动力学参数。 从纯数学的角度讲,这种使用最多的用起始速率和起始浓度来求Km和Vman的方法,无论反应时间多少都存在偏差,只是反应时间短的时候偏差小而已,我们把这种方法本身引起的误差成为系统误差。那是不是存在一种没有系统误差的方法呢?关于酶动力学参数的计算方法在上世纪70-90年代,研究最多,但那时计算技术并不发达,所以研究者们设计了多种米曼方程的变体,还有很多作图的方法来求Km和Vmax。我认为现在的计算技术已经足够发达,肯定能实现没有系统偏差的计算方法。还有一种酶动力学研究方法,就是测定随着反应时间的延长,底物浓度的变化,再通过拟合积分以后的米曼方程进行求参。但随着反应时间的增长,酶的活性会发生变化,所以这样测定的浓度,越到后面越不能反应酶的活性。从实验的角度考虑,还是测定系列起始浓度,反应固定时间以后,测定剩余浓度(或代谢物浓度)的方法更靠谱。 假定起始浓度为C0,反应t时间以后的浓度变为C1,改变起始浓度C0,我们就可以得到系列的C1。根据积分以后的米曼方程,可以得到C0与C1的关系如下: Integrated Michaelis-Menten Equation (IMM) 这个方程为隐式方程,不能表示为显示方程,也就是y=f(x)这种形式。现有的建模工具,就我所知,都不支持隐式方程的求参,也许存在这样的工具,但我不知道。我直觉上感觉用Excel可以实现,所以在一个月前开始用Excel的Solver和单变量求解工具设计能够对这样的隐式方程求参的算法,大约用了1周多时间,就写好了一个算法。模拟的结果显示,当数据中不含噪音时,可以无偏的求到正确的参数,而一但增加噪音,求参结果就显得非常不可靠,我一度认为这正式IMM的缺点。此外,我还设计另一种与现有的算法(TM)偏差相反的算法PM,希望通过两种算法的平均,达到偏差消除,从而求出正确的解。就在昨天,我还设计了Robustness参数,APDD, APF等参数,通过比较它们之间的大小,自动判断哪种算法获得的结果更可靠。本打算今天下午的Seminar向老板汇报工作,但老板有事外出,Seminar被取消。早知Seminar被取消的话,我这两天就不用那么辛苦赶工了,心里有种极放松的感觉。暂时没有其他的事情,我就在EnzySolver上模拟不同的数据,看看结果如何,可能存在什么规律。突然,我发现前面设计的求解算法有问题,当C1这一列没有噪音的时候,只要一个循环就可以得到正确的解,而当它有噪音时,整个算法Solver仅相当于只迭代一次,怪不得误差会比较大呢。在晚上回家前,终于完成了那个迭代算法,模拟结果显示,即便存在很大噪音,其求的参数总是在各种算法中最接近真实值的,竟然比我用群体的方法(理论上考虑了误差模型)还精确,不可思议。我本来打算用Phoenix的NLME方法作为压轴的终极解决方案呢。我暂不知道我设计这种隐式方程的求参方法是否别人已经发表过,也不知道它是否可以用于其他隐式方程,是否具有通用性,这些都需要后面的工具进一步验证。 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。