甘草黄酮的裂解(4):甘草查儿酮B(Licochalcone B)

甘草查儿酮B的裂解途径 今天这个化合物属于查儿酮,仅一个苷元,没有连接糖,看似简单,其实非常复杂,越是这种结构比较单一的,可能解析起来越难。A环上与查儿酮羰基相邻的碳原子上没有羟基,它不能互变成二氢黄酮,所以主要发生与烯键(alpha-,beta-碳原子)相邻的位置的断裂,如负离子模式中的m/z 191和150,正离子模式中的m/z 121, 147, 167和193。此外,负离子质谱图中,最高的为丢失甲基自由基厚的碎片m/z 270。以上这些碎片都比较容易归属,最难的是负离子中的m/z 253和正离子中的m/z 245。负离子质谱中的m/z 253,为丢失32Da的碎片,推测丢失一分子甲醇,也就是可能与B环上的甲氧基有关。在上图的左侧我给出了可能的裂解途径:B环上3',4'-OH烯醇互变为酮式,这时在甲氧基的邻位出现一个sp3杂化的碳原子,其上的氢可与甲氧基一起消除,得到m/z 253。这个途径是我想了2天才推测出来的,不知还有没有更好的解释。正离子模式中的m/z 245为基峰,我推测其裂解过程见上图的右侧:4‘-OH上的氢重排到alpha-碳原子上,然后发生1,3-断裂,失去C2H2O,然后两侧基团连起来形成m/z 245。碎片m/z 245为两个苯环形成的大共轭体系,非常稳定,故其为基峰。 总算把这个化合物解析完毕,心里舒服多了。几个小时前,自己被Mac中的ChemDraw折麽的要发疯了,老是无缘无故自动退出,画了一半的工作丢失了好几次,又换了JSDraw, Markvin,但总没有ChemDraw用的顺手,最后不得不重新回到windows去完成剩余的工作。ChemDraw画的结构不能自动对杂原子标记颜色,只能手工一个一个选择杂原子,然后设定颜色,显得有点笨笨。为了好看,忍了! 甘草查儿酮B的正负离子质谱图   ===================================================== 化合物:Licochalcone B 分子量:286.3 分子式:C16H14O5 SMILES: O=C(/C=C/C1=CC=C(O)C(O)=C1OC)C2=CC=C(O)C=C2 InChIKey: DRDRYGIIYOPBBZ-XBXARRHUSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(3):甘草苷(Liquiritin)

甘草苷的裂解途径 甘草苷在正负离子模式下均发生糖苷键断裂,断裂的类型和丢失的中性碎片完全一样,见上图。这种断裂方式在ESI质谱中最常见,我在硕士论文中将这类反应称为“1,3-断裂”,即发生断裂的键为第1个(起始端)和第3个根键(末端),同时两端的基团连接起来,中间的第2根键形成双键(形成一个新键)。当第2根键中间插入n个双键以后,这个规律仍然成立,只是变成"1,2n+1-断裂"(n=1,2,3...)。只要起始段和末端的基团丢去以后,中间可以形成稳定的共轭体系,那这样的反应就容易发生,并且起始端和末端的键在空间上并不需要靠近,它们仍可以形成连接以后的产物,参见我以前写的“奇怪的远距离重排”。 昨天我提到没有看到甘草素断裂的碎片,我想可能是因为我们的质谱图来自文献的表格数据,而不是实测的质谱图,作者给出的有可能仅是主要的碎片,一些丰度较低的碎片就被忽略了。 甘草苷的质谱图   ===================================================== 化合物:Liquiritin 分子量:418.4 分子式:C21H11O09 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(O)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: DEMKZLAVQYISIA-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,网站:msky.in,每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

甘草黄酮的裂解(2):7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

化合物2的正负离子质谱图 今天化合物的正负离子质谱图与昨天的第一个化合物非常接近,只是离子的丰度有些差别,它们为一对同分异构体。我感觉比较奇怪的是,这两个化合物都没有看到C环开裂的产物,难道是仪器或碰撞能量的缘故?若C环开环形成查儿酮,那么其稳定性自然会有较大提高,看不到母核碎片倒可以理解。 化合物2的裂解途径 今晚状态不佳,应该早点睡的。想起几件拖了很久的事,头痛呀,至少这周搞定一件吧。看到DXY有人讨论严新气功与哈佛医学院刚合作发表的文章,某些人像打了鸡血一样,这使我想起了春风得意的孔乙己,哎,都是可怜人呐!不说他们了,按照罗胖的说法,见了狗屎还是绕着走好,不要非去证明它怎么样,它根本就不需要去关注。 ===================================================== 化合物:7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (2) 分子量:550.5 分子式:C26H30O13 SMILES: O=C1C(C=CC(OC2C(OC3C(O)C(CO)(O)CO3)C(O)C(O)C(CO)O2)=C4)=C4OC(C5=CC=C(O)C=C5)C1 InChIKey:NLALNSGFXCKLLY-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

非线性拟合的一个前提条件:观测变量等方差分布

当我想好这个题目的时候,我顺便放狗搜了一下,找到几个非常对我胃口的博客(数据科学与R语言,Yihui Xie)。在看其中文档的过程中,我曾有短暂的失落感,“我在统计方面的知识太逊了”,不过我马上意识到自己又陷入了完美主义的坑,一个人怎能那方面都那么出色呢?在统计领域,我只要知道有哪些流行技术,哪些对我现在的研究课题有帮助,或者将来有帮助即可,只要分类整理入自己的笔记即可,完全可以等到需要的时候再去学。我自己喜欢的专业才是最根本的,这个是核心,其他只是点缀而已。我的目标是,“比药学家懂统计,比统计学家懂药学”! 为什么会想写这个题目呢?因为今天做酶动力学的模拟实验的时候,确实发现了这种现象,只有观测变量(因变量)的误差的方差恒定时,用非线性拟合得到的参数才是无偏的。对于线性拟合,只有满足高斯--马尔科夫定理条件时(零均值、等方差、不相关),最小二乘估计才是无偏估计。应该这对非线性拟合,同样适用吧。如果观测变量的误差不满足高-马条件时(比如方差随观测变量的增大而增大,可以从残差图上看到),该如何进行无偏估计呢?其实前几天已经提到了,正是Phoenix中的可进行群体药动学分析的PML!其所采用的技术为非线性混合效应模型法,广泛用于群体药动学参数的估计,模型中包含固定效应(相当于传统的非线性模型部分)、随机效应(个体间的变异)和误差模型(这里可以针对不同类型的误差进行建模,关键所在)。下面给出一个模拟实例,来说明用NLME进行非等方差时的参数估计。 模拟数据用EnzySolver的模拟功能来实现,具体参数如下: EnzySolver模拟数据,误差方差随浓度的增加而增加 模拟后的数据和误差分布如下: 用EnzySolver自带的非线性拟合功能,求得的参数为,与理论值有较大偏差,尤其是Km偏差快到10%了。将模拟的数据带入phoenix的PML模型,先假定误差模型为CObs=C+CEps (CObs观测值,C真实值,CEps误差项),拟合结果如下: 如上所求参数确有很大偏差,并且残差分布趋势随着浓度的增加而增大,这也提示所选择的误差模型不合适。将误差模型改为CObs=C+C*CEps,拟合结果如下: 可见,在我们选择了合适的误差模型以后,所求算的Km和Vm与理论值就非常接近了,且所估计的方差0.013与理论方差0.02相当接近。 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

甘草黄酮的裂解(1):4‘-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

4’-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的裂解途径 从今天起,我们将介绍一系列甘草黄酮的裂解途径。甘草黄酮的主要类型有二氢黄酮、查儿酮、异黄酮和二氢异黄酮等,今天第一个化合物属于二氢黄酮,为甘草苷的葡萄糖的二位上又连了一个洋芹糖,不知道这样的双糖是否有个名字。下图为其在负离子和正离子模式下的二级质谱图,文献中只给出了离子强度和丰度,我们用自己编写的applet控件画出了质谱图,以便直观的查看。在负离子模式下,主要为甘草素的-离子和丢失120Da的碎片离子m/z 429。丢失120Da是1-2连接的双糖的特征,在我们以前发表的文章中曾经用高分辨质谱证明过,120Da来自于糖断裂,而不是C环RDA裂解。m/z 429进一步失去洋芹糖(132Da),得到m/z 297。此外,直接丢失洋芹糖的碎片离子m/z 417丰度很低,仅为4%,说明在负离子模式下,1-2连接双糖的葡萄糖更容易发生分子内断裂。在正离子模式下,丢失洋芹糖的碎片离子m/z 419丰度较高,丢失双糖的m/z 257为基峰。正离子模式下相当于酸性环境,可认为更有利于这些糖苷键的断裂。   4‘-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的正负离子二级质谱图 ===================================================== 化合物:4’-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (1) 分子量:550.5 分子式:C26H30O13 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(OC5C(O)C(CO)(O)CO5)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: FTVKHUHJWDMWIR-UHFFFAOYSA-N 参考文献:10.1002/rcm.4215 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

酶动力学的PML模型

群体的加权残差与观测浓度的分布 前面我们用Excel和Matlab实现了酶动力学的参数估算方法,今天我们介绍使用药动建模工具phoenix来进行酶动力学分析。正如我们前面提到的,phoenix不支持隐式方程的求参,所以需要对数据进行一下变通,通过观察IMM方程,我们发现,虽然C0和C1之间不能用显示方程表示,但是C1和t之间的关系却可以写成显示方程,一系列的C1和对应的反应时间t我们都知道,C0可以类比于PK中的给药剂量。这种处理方式类似群体PK,每个个体在t时间采一个点,存在大量个体,每个个体的给药剂量不同,这种稀疏的数据只能用群体的模型去估计。为了实现群体PK,这就需要用到PML,即Phoenix Model Language。PML是借鉴了C++,S-Plus中的一些规范的用于Phoenix平台的建模语言,可进行非线性混合效应(NLME)分析。NLME背后的原理理解起来有点困难,但我们作为药学人士,没必要搞懂其具体的原理,只要我们会用这门语言编写满足我们要求的模型代码即可。我的原则是,够用即可,多了不学。PML支持微分方程和显示方程,C1与t的关系用微分方程表示更简单,其实就是最常见的米曼方程: dC/dt=-Vm*C/(Km+C) EnzymeKinetics(){ //米曼方程 deriv(C = - Vm*C/(Km + C)) //dose的位置,即初始浓度是加在C这个变量上 dosepoint(C) //误差模型,一般是additive,看看残差分布是否随机,如果不随机,可以用multiplictive等其他误差模型 error(CEps = 1) observe(CObs = C + CEps) //CObs是观测值,这个不能变,其等于C加误差 /*结构参数,这个主要是用来考虑个体之间的波动,其认为存在一个群体的值,即tvVm和tvKm,而对于每个个体来说,它们又有自己特定的值*/ stparm(Vm = (tvVm) *…

隐式方程的matlab实现:酶动力学(Integrated Michaelis-Menten Equation)的无偏参数求解

神奇而强大的计算分析平台 Google搜索了一下,发现隐式方程的求参问题有不少解决方案,matlab, R都可以实现。基本思路与我用Excel求参的方法一样,先编写一个函数来实现隐式方程的显示化,matlab中要用到fzero或fsolve(Excel中用的是单变量求解插件),然后再用非线性求解函数进行参数拟合。下面是积分后的米曼方程(IMM)的matlab求参代码: 先构造IMM函数: function y=IMM(p,x) %输入参数 Vm=p(1); Km=p(2); y=zeros(size(x)); NN=length(x); %不输出提示 opt = optimset('display','off'); for i=1:NN %就是用这个方程来求出某个x(i)下的解,y的初值设定为x(i)*0.9 y(i)=fzero(@(y) x(i) -y-Vm*15+Km*log(x(i)/y), x(i)*0.9, opt); end end 上面的函数写好后,保存,最后只要用下面一行命令就可以求解参数了: X=lsqcurvefit(@(params, xdata) IMM(params, xdata),...…

酶动力学数据分析工具:EnzySolver 1.0

EnzySolver 1.0界面 前段时间进行体内外相关性建模,遇到需用体外酶动力学参数预测体内的消除程度,在与做试验的同学讨论的时候,发现大家应用米曼方程并不注意前提条件,比如需控制反应时间或起始浓度,使反应结束时,底物的消除不要超过10%,否则计算的反应速率就与真正的起始速率有很大偏差,用这样获得的有偏差的起始速率与起始浓度求算Km和Vmax,必定难以获得真实的酶动力学参数。 从纯数学的角度讲,这种使用最多的用起始速率和起始浓度来求Km和Vman的方法,无论反应时间多少都存在偏差,只是反应时间短的时候偏差小而已,我们把这种方法本身引起的误差成为系统误差。那是不是存在一种没有系统误差的方法呢?关于酶动力学参数的计算方法在上世纪70-90年代,研究最多,但那时计算技术并不发达,所以研究者们设计了多种米曼方程的变体,还有很多作图的方法来求Km和Vmax。我认为现在的计算技术已经足够发达,肯定能实现没有系统偏差的计算方法。还有一种酶动力学研究方法,就是测定随着反应时间的延长,底物浓度的变化,再通过拟合积分以后的米曼方程进行求参。但随着反应时间的增长,酶的活性会发生变化,所以这样测定的浓度,越到后面越不能反应酶的活性。从实验的角度考虑,还是测定系列起始浓度,反应固定时间以后,测定剩余浓度(或代谢物浓度)的方法更靠谱。 假定起始浓度为C0,反应t时间以后的浓度变为C1,改变起始浓度C0,我们就可以得到系列的C1。根据积分以后的米曼方程,可以得到C0与C1的关系如下: Integrated Michaelis-Menten Equation (IMM) 这个方程为隐式方程,不能表示为显示方程,也就是y=f(x)这种形式。现有的建模工具,就我所知,都不支持隐式方程的求参,也许存在这样的工具,但我不知道。我直觉上感觉用Excel可以实现,所以在一个月前开始用Excel的Solver和单变量求解工具设计能够对这样的隐式方程求参的算法,大约用了1周多时间,就写好了一个算法。模拟的结果显示,当数据中不含噪音时,可以无偏的求到正确的参数,而一但增加噪音,求参结果就显得非常不可靠,我一度认为这正式IMM的缺点。此外,我还设计另一种与现有的算法(TM)偏差相反的算法PM,希望通过两种算法的平均,达到偏差消除,从而求出正确的解。就在昨天,我还设计了Robustness参数,APDD, APF等参数,通过比较它们之间的大小,自动判断哪种算法获得的结果更可靠。本打算今天下午的Seminar向老板汇报工作,但老板有事外出,Seminar被取消。早知Seminar被取消的话,我这两天就不用那么辛苦赶工了,心里有种极放松的感觉。暂时没有其他的事情,我就在EnzySolver上模拟不同的数据,看看结果如何,可能存在什么规律。突然,我发现前面设计的求解算法有问题,当C1这一列没有噪音的时候,只要一个循环就可以得到正确的解,而当它有噪音时,整个算法Solver仅相当于只迭代一次,怪不得误差会比较大呢。在晚上回家前,终于完成了那个迭代算法,模拟结果显示,即便存在很大噪音,其求的参数总是在各种算法中最接近真实值的,竟然比我用群体的方法(理论上考虑了误差模型)还精确,不可思议。我本来打算用Phoenix的NLME方法作为压轴的终极解决方案呢。我暂不知道我设计这种隐式方程的求参方法是否别人已经发表过,也不知道它是否可以用于其他隐式方程,是否具有通用性,这些都需要后面的工具进一步验证。 –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

苯乙基色原酮的裂解第10期:6,7-dimethoxy-2-phenethyl-4H-chromen-4-one

甲基自由基 今天是苯乙基色原酮系列的最后一个化合物,晚上还有重要的任务,需尽快完成今天的更新。 QD-14与第5期的QD-7的B还上均没有取代基,只能发生C11-C12均裂,生成自由基离子,然后质子分别挂在两侧,得到m/z 220和91。QD-14结构上有两个甲氧基,照理应该看到掉甲基自由基的碎片呀,当我用自己2.5的眼找了一遍后,还真发现一个m/z 205,你看到了吗? 至此,苯乙基色原酮的系列化合物的裂解规律我们都介绍完毕了,感兴趣的你是否学到一些质谱解析相关的知识了呢?这类化合物的裂解比较简单,以这样的一类化合物开始,比较容易产生成就感,后面我会逐步介绍一些比较难的例子,如果一路看下去,那些难得其实也不难,真正难的是解不出来的!也许后面我该多穿插介绍一下我以前在建模方面的工作,毕竟MS的含义是二重的,而我这段时间又主要再搞建模,有了不少积累,慢慢放出来吧。 MS2 of QD-14 ===================================================== 化合物:6,7-dimethoxy-2-phenethyl-4H-chromen-4-one(QD-14) SMILES: O=C1C2=CC(OC)=C(OC)C=C2OC(CCC3=CC=CC=C3)=C1 InChIKey: MVQOWXHYPYRBOE-UHFFFAOYSA-N 参考文献:10.1002/jms.3242   –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。

苯乙基色原酮的裂解第9期:2-(2-hydroxy-2-(4-hydroxyphenyl)ethyl)-4H-chromen-4-one

分子内羟基迁移 QD-22的结构仅比昨天的QD-11少一个甲基,所以它们的MS2看上去非常相似,基峰均为m/z 161。由于B环上的甲氧基变成成了羟基,对应的含B环碎片减少14Da,即m/z 123。比较奇怪的是QD-22多了一个碎片m/z 107。前面介绍的QD-27-1也具有4'-OH,同样生成了m/z 107,可以推测m/z 107与B环的对位羟基有关。经过半个多小时的思索,我构建了一个可能的裂解途径,见上图。质子化的12-OH进攻旁边的1'位,形成环氧中间体,同时质子转移到2'位C原子上;环氧开环,正电荷转移到C12原子;下一步,C-1'上的羟基转移到C-11上,C11-C12键断裂,这时就生成了m/z 107和中性碎片176。这个途径不如C11-C12直接断裂容易,生成的碎片离子的丰度很低。当我想出了这个裂解途径以后,又想到,假如这个途径是正确的,一定存在电荷在A,C环上的碎片离子,正如C11-C12断裂以后,电荷可以分别存在两侧的碎片上,因此应该存在m/z 177的碎片离子(即中性碎片176质子化的碎片)。经仔细观察QD-22的MS2,确实在m/z 177的位置上,发现极弱的信号。当然这也有可能是背景噪音,需要进一步实验验证。 QD-22的MS2 在过去的一个多月中,我在鼓捣酶动力学数据的分析方法,希望找到一种通用的、没有系统偏差的算法。前些日子一直没有进展,昨天学习了群体药动学技术以后,突然领悟到,这个酶动力学测定的实验,可看作大量受试者仅采一个时间点血样的实验设计,这不正是群体药动可以分析的数据吗?!经过简单的数据格式化,今天终于获得了一个比较满意的结果。根据模拟数据的结果,加上噪音后的数据,群体的方法仍可以准确估算参数,大大由于PM, TM, IMM等方法。 ===================================================== 化合物:2-(2-hydroxy-2-(4-hydroxyphenyl)ethyl)-4H-chromen-4-one(QD-22) SMILES: O=C1C2=CC=CC=C2OC(CC(O)C3=CC=C(O)C=C3)=C1 InChIKey: UNNQNQLODLRMBI-UHFFFAOYSA-N 参考文献:10.1002/jms.3242   –EOF– 文章来自,微信号:MS4Fun,不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情,欢迎分享与推荐。