August 2013 – Page 3 – MS Blog of Dr. Zhang

甘草黄酮的裂解(6)：芒柄花素(Formononetin)

Yufeng Zhang August 11, 2013 0Comments

芒柄花素的裂解途径今天把裂解途径的图稍微美化了一下，看起来更舒服一些，负离子模式的裂解用绿色背景，正离子模式的裂解用黄色背景。芒柄花素属于异黄酮，结构很稳定，需要较高的能量才可以碎裂。这个化合物早在20多年前人们就开始研究其裂解规律了，参看Antignac的文章。不同的质谱仪和能量获得的质谱图有很大差异，现阶段基本仍需要人工去分析特定的数据，没有办法像EI-MS那样建一个标准品的谱库，然后检索比对即可得到结果。你可以比较一下下面来自不同文献的质谱数据，直观体验一下差别。上图给出了主要碎片的裂解途径，更详细的碎片分析，可以参看Antignac的文章。文章的化合物信息部分做了一些小改动，点击化合物的SMILES查看结构，点击InChIKey查看3D结构，这主要归功于NCI/CADD Group的工作。芒柄花素负离子模式二级质谱图(From 10.1002/rcm.1052) 芒柄花素的正负离子模式质谱图（From 10.1002/rcm.4215） ===================================================== 化合物：Formononetin 分子量：268.3 分子式：C16H12O4 SMILES: COC1=CC=C(C2=COC3=C(C=CC(O)=C3)C2=O)C=C1 InChIKey: HKQYGTCOTHHOMP-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，网站：msky.in，每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

Mass Spectrometry

甘草黄酮的裂解(5)：甘草酸(Glycyrrhizic Acid)

Yufeng Zhang August 10, 2013 0Comments

甘草酸的裂解途径甘草酸虽不属于黄酮，但它是甘草中一个很重要的成分，我们顺便也分析下它的裂解途径。甘草酸的结构中有一个双葡萄糖醛酸，酸性较强，在负离子模式下，负电荷主要分布在与干草次酸相连的葡萄糖醛酸的羧基上，丢失甘草次酸，形成基峰m/z 351；此外，也可以丢失一分子脱水葡萄糖醛酸或葡萄糖醛酸脱水、开环，形成负离子质谱图中丰度比较低的碎片离子。在正离子模式，电荷在甘草次酸的11-位羰基上，丢失脱水的双葡萄糖醛酸得到m/z 471。由于这个3-位的糖苷键，在糖和苷元两侧都有alpha-氢原子，所以除了m/z 471，还可以丢失双葡萄糖醛酸形成m/z 453。m/z 647为丢失一分子脱水葡萄糖醛酸的碎片，裂解途径与负离子模式中的结构完全一样。甘草酸的正负离子质谱图 ===================================================== 化合物：Glycyrrhizic Acid 分子量：822.9 分子式：C42H62O16 SMILES: CC1(C2CCC3(C(C2(CCC1OC4C(C(C(C(O4)C(=O)O)O)O)OC5C(C(C(C(O5)C(=O)O)O)O)O)C)C(=O)C=C6C3(CCC7(C6CC(CC7)(C)C(=O)O)C)C)C)C InChIKey: LPLVUJXQOOQHMX-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，网站：msky.in，每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

Mass Spectrometry

甘草黄酮的裂解(4)：甘草查儿酮B(Licochalcone B)

Yufeng Zhang August 9, 2013 0Comments

甘草查儿酮B的裂解途径今天这个化合物属于查儿酮，仅一个苷元，没有连接糖，看似简单，其实非常复杂，越是这种结构比较单一的，可能解析起来越难。A环上与查儿酮羰基相邻的碳原子上没有羟基，它不能互变成二氢黄酮，所以主要发生与烯键（alpha-,beta-碳原子）相邻的位置的断裂，如负离子模式中的m/z 191和150，正离子模式中的m/z 121, 147, 167和193。此外，负离子质谱图中，最高的为丢失甲基自由基厚的碎片m/z 270。以上这些碎片都比较容易归属，最难的是负离子中的m/z 253和正离子中的m/z 245。负离子质谱中的m/z 253，为丢失32Da的碎片，推测丢失一分子甲醇，也就是可能与B环上的甲氧基有关。在上图的左侧我给出了可能的裂解途径：B环上3',4'-OH烯醇互变为酮式，这时在甲氧基的邻位出现一个sp3杂化的碳原子，其上的氢可与甲氧基一起消除，得到m/z 253。这个途径是我想了2天才推测出来的，不知还有没有更好的解释。正离子模式中的m/z 245为基峰，我推测其裂解过程见上图的右侧：4‘-OH上的氢重排到alpha-碳原子上，然后发生1,3-断裂，失去C2H2O，然后两侧基团连起来形成m/z 245。碎片m/z 245为两个苯环形成的大共轭体系，非常稳定，故其为基峰。总算把这个化合物解析完毕，心里舒服多了。几个小时前，自己被Mac中的ChemDraw折麽的要发疯了，老是无缘无故自动退出，画了一半的工作丢失了好几次，又换了JSDraw, Markvin，但总没有ChemDraw用的顺手，最后不得不重新回到windows去完成剩余的工作。ChemDraw画的结构不能自动对杂原子标记颜色，只能手工一个一个选择杂原子，然后设定颜色，显得有点笨笨。为了好看，忍了！甘草查儿酮B的正负离子质谱图 ===================================================== 化合物：Licochalcone B 分子量：286.3 分子式：C16H14O5 SMILES: O=C(/C=C/C1=CC=C(O)C(O)=C1OC)C2=CC=C(O)C=C2 InChIKey: DRDRYGIIYOPBBZ-XBXARRHUSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，网站：msky.in，每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

Mass Spectrometry

甘草黄酮的裂解(3)：甘草苷(Liquiritin)

Yufeng Zhang August 8, 2013 0Comments

甘草苷的裂解途径甘草苷在正负离子模式下均发生糖苷键断裂，断裂的类型和丢失的中性碎片完全一样，见上图。这种断裂方式在ESI质谱中最常见，我在硕士论文中将这类反应称为“1,3-断裂”，即发生断裂的键为第1个（起始端）和第3个根键（末端），同时两端的基团连接起来，中间的第2根键形成双键（形成一个新键）。当第2根键中间插入n个双键以后，这个规律仍然成立，只是变成"1,2n+1-断裂"（n=1,2,3...）。只要起始段和末端的基团丢去以后，中间可以形成稳定的共轭体系，那这样的反应就容易发生，并且起始端和末端的键在空间上并不需要靠近，它们仍可以形成连接以后的产物，参见我以前写的“奇怪的远距离重排”。昨天我提到没有看到甘草素断裂的碎片，我想可能是因为我们的质谱图来自文献的表格数据，而不是实测的质谱图，作者给出的有可能仅是主要的碎片，一些丰度较低的碎片就被忽略了。甘草苷的质谱图 ===================================================== 化合物：Liquiritin 分子量：418.4 分子式：C21H11O09 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(O)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: DEMKZLAVQYISIA-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，网站：msky.in，每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

Mass Spectrometry

甘草黄酮的裂解(2)：7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

Yufeng Zhang August 7, 2013 0Comments

化合物2的正负离子质谱图今天化合物的正负离子质谱图与昨天的第一个化合物非常接近，只是离子的丰度有些差别，它们为一对同分异构体。我感觉比较奇怪的是，这两个化合物都没有看到C环开裂的产物，难道是仪器或碰撞能量的缘故？若C环开环形成查儿酮，那么其稳定性自然会有较大提高，看不到母核碎片倒可以理解。化合物2的裂解途径今晚状态不佳，应该早点睡的。想起几件拖了很久的事，头痛呀，至少这周搞定一件吧。看到DXY有人讨论严新气功与哈佛医学院刚合作发表的文章，某些人像打了鸡血一样，这使我想起了春风得意的孔乙己，哎，都是可怜人呐！不说他们了，按照罗胖的说法，见了狗屎还是绕着走好，不要非去证明它怎么样，它根本就不需要去关注。 ===================================================== 化合物：7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (2) 分子量：550.5 分子式：C26H30O13 SMILES: O=C1C(C=CC(OC2C(OC3C(O)C(CO)(O)CO3)C(O)C(O)C(CO)O2)=C4)=C4OC(C5=CC=C(O)C=C5)C1 InChIKey:NLALNSGFXCKLLY-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Modeling & Simulation

非线性拟合的一个前提条件：观测变量等方差分布

Yufeng Zhang August 6, 2013 0Comments

当我想好这个题目的时候，我顺便放狗搜了一下，找到几个非常对我胃口的博客（数据科学与R语言，Yihui Xie）。在看其中文档的过程中，我曾有短暂的失落感，“我在统计方面的知识太逊了”，不过我马上意识到自己又陷入了完美主义的坑，一个人怎能那方面都那么出色呢？在统计领域，我只要知道有哪些流行技术，哪些对我现在的研究课题有帮助，或者将来有帮助即可，只要分类整理入自己的笔记即可，完全可以等到需要的时候再去学。我自己喜欢的专业才是最根本的，这个是核心，其他只是点缀而已。我的目标是，“比药学家懂统计，比统计学家懂药学”！为什么会想写这个题目呢？因为今天做酶动力学的模拟实验的时候，确实发现了这种现象，只有观测变量（因变量）的误差的方差恒定时，用非线性拟合得到的参数才是无偏的。对于线性拟合，只有满足高斯--马尔科夫定理条件时（零均值、等方差、不相关），最小二乘估计才是无偏估计。应该这对非线性拟合，同样适用吧。如果观测变量的误差不满足高-马条件时（比如方差随观测变量的增大而增大，可以从残差图上看到），该如何进行无偏估计呢？其实前几天已经提到了，正是Phoenix中的可进行群体药动学分析的PML！其所采用的技术为非线性混合效应模型法，广泛用于群体药动学参数的估计，模型中包含固定效应（相当于传统的非线性模型部分）、随机效应（个体间的变异）和误差模型（这里可以针对不同类型的误差进行建模，关键所在）。下面给出一个模拟实例，来说明用NLME进行非等方差时的参数估计。模拟数据用EnzySolver的模拟功能来实现，具体参数如下： EnzySolver模拟数据，误差方差随浓度的增加而增加模拟后的数据和误差分布如下：用EnzySolver自带的非线性拟合功能，求得的参数为，与理论值有较大偏差，尤其是Km偏差快到10%了。将模拟的数据带入phoenix的PML模型，先假定误差模型为CObs=C+CEps (CObs观测值，C真实值，CEps误差项)，拟合结果如下：如上所求参数确有很大偏差，并且残差分布趋势随着浓度的增加而增大，这也提示所选择的误差模型不合适。将误差模型改为CObs=C+C*CEps，拟合结果如下：可见，在我们选择了合适的误差模型以后，所求算的Km和Vm与理论值就非常接近了，且所估计的方差0.013与理论方差0.02相当接近。 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Mass Spectrometry

甘草黄酮的裂解(1)：4‘-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

Yufeng Zhang August 5, 2013 0Comments

4’-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的裂解途径从今天起，我们将介绍一系列甘草黄酮的裂解途径。甘草黄酮的主要类型有二氢黄酮、查儿酮、异黄酮和二氢异黄酮等，今天第一个化合物属于二氢黄酮，为甘草苷的葡萄糖的二位上又连了一个洋芹糖，不知道这样的双糖是否有个名字。下图为其在负离子和正离子模式下的二级质谱图，文献中只给出了离子强度和丰度，我们用自己编写的applet控件画出了质谱图，以便直观的查看。在负离子模式下，主要为甘草素的-离子和丢失120Da的碎片离子m/z 429。丢失120Da是1-2连接的双糖的特征，在我们以前发表的文章中曾经用高分辨质谱证明过，120Da来自于糖断裂，而不是C环RDA裂解。m/z 429进一步失去洋芹糖(132Da)，得到m/z 297。此外，直接丢失洋芹糖的碎片离子m/z 417丰度很低，仅为4%，说明在负离子模式下，1-2连接双糖的葡萄糖更容易发生分子内断裂。在正离子模式下，丢失洋芹糖的碎片离子m/z 419丰度较高，丢失双糖的m/z 257为基峰。正离子模式下相当于酸性环境，可认为更有利于这些糖苷键的断裂。 4‘-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的正负离子二级质谱图 ===================================================== 化合物：4’-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (1) 分子量：550.5 分子式：C26H30O13 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(OC5C(O)C(CO)(O)CO5)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: FTVKHUHJWDMWIR-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Modeling & Simulation

酶动力学的PML模型

Yufeng Zhang August 4, 2013 0Comments

群体的加权残差与观测浓度的分布前面我们用Excel和Matlab实现了酶动力学的参数估算方法，今天我们介绍使用药动建模工具phoenix来进行酶动力学分析。正如我们前面提到的，phoenix不支持隐式方程的求参，所以需要对数据进行一下变通，通过观察IMM方程，我们发现，虽然C0和C1之间不能用显示方程表示，但是C1和t之间的关系却可以写成显示方程，一系列的C1和对应的反应时间t我们都知道，C0可以类比于PK中的给药剂量。这种处理方式类似群体PK，每个个体在t时间采一个点，存在大量个体，每个个体的给药剂量不同，这种稀疏的数据只能用群体的模型去估计。为了实现群体PK，这就需要用到PML，即Phoenix Model Language。PML是借鉴了C++，S-Plus中的一些规范的用于Phoenix平台的建模语言，可进行非线性混合效应（NLME）分析。NLME背后的原理理解起来有点困难，但我们作为药学人士，没必要搞懂其具体的原理，只要我们会用这门语言编写满足我们要求的模型代码即可。我的原则是，够用即可，多了不学。PML支持微分方程和显示方程，C1与t的关系用微分方程表示更简单，其实就是最常见的米曼方程: dC/dt=-Vm*C/(Km+C) EnzymeKinetics(){ //米曼方程 deriv(C = - Vm*C/(Km + C)) //dose的位置，即初始浓度是加在C这个变量上 dosepoint(C) //误差模型，一般是additive，看看残差分布是否随机，如果不随机，可以用multiplictive等其他误差模型 error(CEps = 1) observe(CObs = C + CEps) //CObs是观测值，这个不能变，其等于C加误差 /*结构参数，这个主要是用来考虑个体之间的波动，其认为存在一个群体的值，即tvVm和tvKm，而对于每个个体来说，它们又有自己特定的值*/ stparm(Vm = (tvVm) *…

Modeling & Simulation

隐式方程的matlab实现：酶动力学（Integrated Michaelis-Menten Equation）的无偏参数求解

Yufeng Zhang August 3, 2013 0Comments

神奇而强大的计算分析平台 Google搜索了一下，发现隐式方程的求参问题有不少解决方案，matlab, R都可以实现。基本思路与我用Excel求参的方法一样，先编写一个函数来实现隐式方程的显示化，matlab中要用到fzero或fsolve（Excel中用的是单变量求解插件），然后再用非线性求解函数进行参数拟合。下面是积分后的米曼方程（IMM）的matlab求参代码：先构造IMM函数： function y=IMM(p,x) %输入参数 Vm=p(1); Km=p(2); y=zeros(size(x)); NN=length(x); %不输出提示 opt = optimset('display','off'); for i=1:NN %就是用这个方程来求出某个x(i)下的解，y的初值设定为x(i)*0.9 y(i)=fzero(@(y) x(i) -y-Vm*15+Km*log(x(i)/y), x(i)*0.9, opt); end end 上面的函数写好后，保存，最后只要用下面一行命令就可以求解参数了： X=lsqcurvefit(@(params, xdata) IMM(params, xdata),...…

Modeling & Simulation

酶动力学数据分析工具：EnzySolver 1.0

Yufeng Zhang August 2, 2013 0Comments

EnzySolver 1.0界面前段时间进行体内外相关性建模，遇到需用体外酶动力学参数预测体内的消除程度，在与做试验的同学讨论的时候，发现大家应用米曼方程并不注意前提条件，比如需控制反应时间或起始浓度，使反应结束时，底物的消除不要超过10%，否则计算的反应速率就与真正的起始速率有很大偏差，用这样获得的有偏差的起始速率与起始浓度求算Km和Vmax，必定难以获得真实的酶动力学参数。从纯数学的角度讲，这种使用最多的用起始速率和起始浓度来求Km和Vman的方法，无论反应时间多少都存在偏差，只是反应时间短的时候偏差小而已，我们把这种方法本身引起的误差成为系统误差。那是不是存在一种没有系统误差的方法呢？关于酶动力学参数的计算方法在上世纪70-90年代，研究最多，但那时计算技术并不发达，所以研究者们设计了多种米曼方程的变体，还有很多作图的方法来求Km和Vmax。我认为现在的计算技术已经足够发达，肯定能实现没有系统偏差的计算方法。还有一种酶动力学研究方法，就是测定随着反应时间的延长，底物浓度的变化，再通过拟合积分以后的米曼方程进行求参。但随着反应时间的增长，酶的活性会发生变化，所以这样测定的浓度，越到后面越不能反应酶的活性。从实验的角度考虑，还是测定系列起始浓度，反应固定时间以后，测定剩余浓度（或代谢物浓度）的方法更靠谱。假定起始浓度为C0，反应t时间以后的浓度变为C1，改变起始浓度C0，我们就可以得到系列的C1。根据积分以后的米曼方程，可以得到C0与C1的关系如下： Integrated Michaelis-Menten Equation (IMM) 这个方程为隐式方程，不能表示为显示方程，也就是y=f(x)这种形式。现有的建模工具，就我所知，都不支持隐式方程的求参，也许存在这样的工具，但我不知道。我直觉上感觉用Excel可以实现，所以在一个月前开始用Excel的Solver和单变量求解工具设计能够对这样的隐式方程求参的算法，大约用了1周多时间，就写好了一个算法。模拟的结果显示，当数据中不含噪音时，可以无偏的求到正确的参数，而一但增加噪音，求参结果就显得非常不可靠，我一度认为这正式IMM的缺点。此外，我还设计另一种与现有的算法（TM）偏差相反的算法PM，希望通过两种算法的平均，达到偏差消除，从而求出正确的解。就在昨天，我还设计了Robustness参数，APDD, APF等参数，通过比较它们之间的大小，自动判断哪种算法获得的结果更可靠。本打算今天下午的Seminar向老板汇报工作，但老板有事外出，Seminar被取消。早知Seminar被取消的话，我这两天就不用那么辛苦赶工了，心里有种极放松的感觉。暂时没有其他的事情，我就在EnzySolver上模拟不同的数据，看看结果如何，可能存在什么规律。突然，我发现前面设计的求解算法有问题，当C1这一列没有噪音的时候，只要一个循环就可以得到正确的解，而当它有噪音时，整个算法Solver仅相当于只迭代一次，怪不得误差会比较大呢。在晚上回家前，终于完成了那个迭代算法，模拟结果显示，即便存在很大噪音，其求的参数总是在各种算法中最接近真实值的，竟然比我用群体的方法（理论上考虑了误差模型）还精确，不可思议。我本来打算用Phoenix的NLME方法作为压轴的终极解决方案呢。我暂不知道我设计这种隐式方程的求参方法是否别人已经发表过，也不知道它是否可以用于其他隐式方程，是否具有通用性，这些都需要后面的工具进一步验证。 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Breaking

甘草黄酮的裂解(6)：芒柄花素(Formononetin)

甘草黄酮的裂解(5)：甘草酸(Glycyrrhizic Acid)

甘草黄酮的裂解(4)：甘草查儿酮B(Licochalcone B)

甘草黄酮的裂解(3)：甘草苷(Liquiritin)

甘草黄酮的裂解(2)：7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

非线性拟合的一个前提条件：观测变量等方差分布

甘草黄酮的裂解(1)：4‘-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

酶动力学的PML模型

隐式方程的matlab实现：酶动力学（Integrated Michaelis-Menten Equation）的无偏参数求解

酶动力学数据分析工具：EnzySolver 1.0

You Missed

Elucidation of Interaction Mechanisms between Irinotecan and Oroxylin A in Rats through Physiologically Based Pharmacokinetic Modeling

Postdoc positions available at CUHK, Hong Kong 香港中文大学博士后岗位

质谱(Mass Spectrometry, MS)与药学研究 (8)

质谱(Mass Spectrometry, MS)与药学研究 (7)