MS Blog of Dr. Zhang

甘草黄酮的裂解(4)：甘草查儿酮B(Licochalcone B)

Yufeng Zhang August 9, 2013 0Comments

甘草查儿酮B的裂解途径今天这个化合物属于查儿酮，仅一个苷元，没有连接糖，看似简单，其实非常复杂，越是这种结构比较单一的，可能解析起来越难。A环上与查儿酮羰基相邻的碳原子上没有羟基，它不能互变成二氢黄酮，所以主要发生与烯键（alpha-,beta-碳原子）相邻的位置的断裂，如负离子模式中的m/z 191和150，正离子模式中的m/z 121, 147, 167和193。此外，负离子质谱图中，最高的为丢失甲基自由基厚的碎片m/z 270。以上这些碎片都比较容易归属，最难的是负离子中的m/z 253和正离子中的m/z 245。负离子质谱中的m/z 253，为丢失32Da的碎片，推测丢失一分子甲醇，也就是可能与B环上的甲氧基有关。在上图的左侧我给出了可能的裂解途径：B环上3',4'-OH烯醇互变为酮式，这时在甲氧基的邻位出现一个sp3杂化的碳原子，其上的氢可与甲氧基一起消除，得到m/z 253。这个途径是我想了2天才推测出来的，不知还有没有更好的解释。正离子模式中的m/z 245为基峰，我推测其裂解过程见上图的右侧：4‘-OH上的氢重排到alpha-碳原子上，然后发生1,3-断裂，失去C2H2O，然后两侧基团连起来形成m/z 245。碎片m/z 245为两个苯环形成的大共轭体系，非常稳定，故其为基峰。总算把这个化合物解析完毕，心里舒服多了。几个小时前，自己被Mac中的ChemDraw折麽的要发疯了，老是无缘无故自动退出，画了一半的工作丢失了好几次，又换了JSDraw, Markvin，但总没有ChemDraw用的顺手，最后不得不重新回到windows去完成剩余的工作。ChemDraw画的结构不能自动对杂原子标记颜色，只能手工一个一个选择杂原子，然后设定颜色，显得有点笨笨。为了好看，忍了！甘草查儿酮B的正负离子质谱图 ===================================================== 化合物：Licochalcone B 分子量：286.3 分子式：C16H14O5 SMILES: O=C(/C=C/C1=CC=C(O)C(O)=C1OC)C2=CC=C(O)C=C2 InChIKey: DRDRYGIIYOPBBZ-XBXARRHUSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，网站：msky.in，每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

Mass Spectrometry

甘草黄酮的裂解(3)：甘草苷(Liquiritin)

Yufeng Zhang August 8, 2013 0Comments

甘草苷的裂解途径甘草苷在正负离子模式下均发生糖苷键断裂，断裂的类型和丢失的中性碎片完全一样，见上图。这种断裂方式在ESI质谱中最常见，我在硕士论文中将这类反应称为“1,3-断裂”，即发生断裂的键为第1个（起始端）和第3个根键（末端），同时两端的基团连接起来，中间的第2根键形成双键（形成一个新键）。当第2根键中间插入n个双键以后，这个规律仍然成立，只是变成"1,2n+1-断裂"（n=1,2,3...）。只要起始段和末端的基团丢去以后，中间可以形成稳定的共轭体系，那这样的反应就容易发生，并且起始端和末端的键在空间上并不需要靠近，它们仍可以形成连接以后的产物，参见我以前写的“奇怪的远距离重排”。昨天我提到没有看到甘草素断裂的碎片，我想可能是因为我们的质谱图来自文献的表格数据，而不是实测的质谱图，作者给出的有可能仅是主要的碎片，一些丰度较低的碎片就被忽略了。甘草苷的质谱图 ===================================================== 化合物：Liquiritin 分子量：418.4 分子式：C21H11O09 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(O)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: DEMKZLAVQYISIA-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，网站：msky.in，每天解析一个天然产物的质谱数据或分享自己在建模方面的心得。

Mass Spectrometry

甘草黄酮的裂解(2)：7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

Yufeng Zhang August 7, 2013 0Comments

化合物2的正负离子质谱图今天化合物的正负离子质谱图与昨天的第一个化合物非常接近，只是离子的丰度有些差别，它们为一对同分异构体。我感觉比较奇怪的是，这两个化合物都没有看到C环开裂的产物，难道是仪器或碰撞能量的缘故？若C环开环形成查儿酮，那么其稳定性自然会有较大提高，看不到母核碎片倒可以理解。化合物2的裂解途径今晚状态不佳，应该早点睡的。想起几件拖了很久的事，头痛呀，至少这周搞定一件吧。看到DXY有人讨论严新气功与哈佛医学院刚合作发表的文章，某些人像打了鸡血一样，这使我想起了春风得意的孔乙己，哎，都是可怜人呐！不说他们了，按照罗胖的说法，见了狗屎还是绕着走好，不要非去证明它怎么样，它根本就不需要去关注。 ===================================================== 化合物：7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (2) 分子量：550.5 分子式：C26H30O13 SMILES: O=C1C(C=CC(OC2C(OC3C(O)C(CO)(O)CO3)C(O)C(O)C(CO)O2)=C4)=C4OC(C5=CC=C(O)C=C5)C1 InChIKey:NLALNSGFXCKLLY-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Modeling & Simulation

非线性拟合的一个前提条件：观测变量等方差分布

Yufeng Zhang August 6, 2013 0Comments

当我想好这个题目的时候，我顺便放狗搜了一下，找到几个非常对我胃口的博客（数据科学与R语言，Yihui Xie）。在看其中文档的过程中，我曾有短暂的失落感，“我在统计方面的知识太逊了”，不过我马上意识到自己又陷入了完美主义的坑，一个人怎能那方面都那么出色呢？在统计领域，我只要知道有哪些流行技术，哪些对我现在的研究课题有帮助，或者将来有帮助即可，只要分类整理入自己的笔记即可，完全可以等到需要的时候再去学。我自己喜欢的专业才是最根本的，这个是核心，其他只是点缀而已。我的目标是，“比药学家懂统计，比统计学家懂药学”！为什么会想写这个题目呢？因为今天做酶动力学的模拟实验的时候，确实发现了这种现象，只有观测变量（因变量）的误差的方差恒定时，用非线性拟合得到的参数才是无偏的。对于线性拟合，只有满足高斯--马尔科夫定理条件时（零均值、等方差、不相关），最小二乘估计才是无偏估计。应该这对非线性拟合，同样适用吧。如果观测变量的误差不满足高-马条件时（比如方差随观测变量的增大而增大，可以从残差图上看到），该如何进行无偏估计呢？其实前几天已经提到了，正是Phoenix中的可进行群体药动学分析的PML！其所采用的技术为非线性混合效应模型法，广泛用于群体药动学参数的估计，模型中包含固定效应（相当于传统的非线性模型部分）、随机效应（个体间的变异）和误差模型（这里可以针对不同类型的误差进行建模，关键所在）。下面给出一个模拟实例，来说明用NLME进行非等方差时的参数估计。模拟数据用EnzySolver的模拟功能来实现，具体参数如下： EnzySolver模拟数据，误差方差随浓度的增加而增加模拟后的数据和误差分布如下：用EnzySolver自带的非线性拟合功能，求得的参数为，与理论值有较大偏差，尤其是Km偏差快到10%了。将模拟的数据带入phoenix的PML模型，先假定误差模型为CObs=C+CEps (CObs观测值，C真实值，CEps误差项)，拟合结果如下：如上所求参数确有很大偏差，并且残差分布趋势随着浓度的增加而增大，这也提示所选择的误差模型不合适。将误差模型改为CObs=C+C*CEps，拟合结果如下：可见，在我们选择了合适的误差模型以后，所求算的Km和Vm与理论值就非常接近了，且所估计的方差0.013与理论方差0.02相当接近。 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Mass Spectrometry

甘草黄酮的裂解(1)：4‘-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

Yufeng Zhang August 5, 2013 0Comments

4’-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的裂解途径从今天起，我们将介绍一系列甘草黄酮的裂解途径。甘草黄酮的主要类型有二氢黄酮、查儿酮、异黄酮和二氢异黄酮等，今天第一个化合物属于二氢黄酮，为甘草苷的葡萄糖的二位上又连了一个洋芹糖，不知道这样的双糖是否有个名字。下图为其在负离子和正离子模式下的二级质谱图，文献中只给出了离子强度和丰度，我们用自己编写的applet控件画出了质谱图，以便直观的查看。在负离子模式下，主要为甘草素的-离子和丢失120Da的碎片离子m/z 429。丢失120Da是1-2连接的双糖的特征，在我们以前发表的文章中曾经用高分辨质谱证明过，120Da来自于糖断裂，而不是C环RDA裂解。m/z 429进一步失去洋芹糖(132Da)，得到m/z 297。此外，直接丢失洋芹糖的碎片离子m/z 417丰度很低，仅为4%，说明在负离子模式下，1-2连接双糖的葡萄糖更容易发生分子内断裂。在正离子模式下，丢失洋芹糖的碎片离子m/z 419丰度较高，丢失双糖的m/z 257为基峰。正离子模式下相当于酸性环境，可认为更有利于这些糖苷键的断裂。 4‘-O-(洋芹糖基-(1-2)-葡萄糖基)-甘草素的正负离子二级质谱图 ===================================================== 化合物：4’-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin (1) 分子量：550.5 分子式：C26H30O13 SMILES: O=C1C(C=CC(O)=C2)=C2OC(C3=CC=C(OC4C(OC5C(O)C(CO)(O)CO5)C(O)C(O)C(CO)O4)C=C3)C1 InChIKey: FTVKHUHJWDMWIR-UHFFFAOYSA-N 参考文献：10.1002/rcm.4215 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Modeling & Simulation

酶动力学的PML模型

Yufeng Zhang August 4, 2013 0Comments

群体的加权残差与观测浓度的分布前面我们用Excel和Matlab实现了酶动力学的参数估算方法，今天我们介绍使用药动建模工具phoenix来进行酶动力学分析。正如我们前面提到的，phoenix不支持隐式方程的求参，所以需要对数据进行一下变通，通过观察IMM方程，我们发现，虽然C0和C1之间不能用显示方程表示，但是C1和t之间的关系却可以写成显示方程，一系列的C1和对应的反应时间t我们都知道，C0可以类比于PK中的给药剂量。这种处理方式类似群体PK，每个个体在t时间采一个点，存在大量个体，每个个体的给药剂量不同，这种稀疏的数据只能用群体的模型去估计。为了实现群体PK，这就需要用到PML，即Phoenix Model Language。PML是借鉴了C++，S-Plus中的一些规范的用于Phoenix平台的建模语言，可进行非线性混合效应（NLME）分析。NLME背后的原理理解起来有点困难，但我们作为药学人士，没必要搞懂其具体的原理，只要我们会用这门语言编写满足我们要求的模型代码即可。我的原则是，够用即可，多了不学。PML支持微分方程和显示方程，C1与t的关系用微分方程表示更简单，其实就是最常见的米曼方程: dC/dt=-Vm*C/(Km+C) EnzymeKinetics(){ //米曼方程 deriv(C = - Vm*C/(Km + C)) //dose的位置，即初始浓度是加在C这个变量上 dosepoint(C) //误差模型，一般是additive，看看残差分布是否随机，如果不随机，可以用multiplictive等其他误差模型 error(CEps = 1) observe(CObs = C + CEps) //CObs是观测值，这个不能变，其等于C加误差 /*结构参数，这个主要是用来考虑个体之间的波动，其认为存在一个群体的值，即tvVm和tvKm，而对于每个个体来说，它们又有自己特定的值*/ stparm(Vm = (tvVm) *…

Modeling & Simulation

隐式方程的matlab实现：酶动力学（Integrated Michaelis-Menten Equation）的无偏参数求解

Yufeng Zhang August 3, 2013 0Comments

神奇而强大的计算分析平台 Google搜索了一下，发现隐式方程的求参问题有不少解决方案，matlab, R都可以实现。基本思路与我用Excel求参的方法一样，先编写一个函数来实现隐式方程的显示化，matlab中要用到fzero或fsolve（Excel中用的是单变量求解插件），然后再用非线性求解函数进行参数拟合。下面是积分后的米曼方程（IMM）的matlab求参代码：先构造IMM函数： function y=IMM(p,x) %输入参数 Vm=p(1); Km=p(2); y=zeros(size(x)); NN=length(x); %不输出提示 opt = optimset('display','off'); for i=1:NN %就是用这个方程来求出某个x(i)下的解，y的初值设定为x(i)*0.9 y(i)=fzero(@(y) x(i) -y-Vm*15+Km*log(x(i)/y), x(i)*0.9, opt); end end 上面的函数写好后，保存，最后只要用下面一行命令就可以求解参数了： X=lsqcurvefit(@(params, xdata) IMM(params, xdata),...…

Modeling & Simulation

酶动力学数据分析工具：EnzySolver 1.0

Yufeng Zhang August 2, 2013 0Comments

EnzySolver 1.0界面前段时间进行体内外相关性建模，遇到需用体外酶动力学参数预测体内的消除程度，在与做试验的同学讨论的时候，发现大家应用米曼方程并不注意前提条件，比如需控制反应时间或起始浓度，使反应结束时，底物的消除不要超过10%，否则计算的反应速率就与真正的起始速率有很大偏差，用这样获得的有偏差的起始速率与起始浓度求算Km和Vmax，必定难以获得真实的酶动力学参数。从纯数学的角度讲，这种使用最多的用起始速率和起始浓度来求Km和Vman的方法，无论反应时间多少都存在偏差，只是反应时间短的时候偏差小而已，我们把这种方法本身引起的误差成为系统误差。那是不是存在一种没有系统误差的方法呢？关于酶动力学参数的计算方法在上世纪70-90年代，研究最多，但那时计算技术并不发达，所以研究者们设计了多种米曼方程的变体，还有很多作图的方法来求Km和Vmax。我认为现在的计算技术已经足够发达，肯定能实现没有系统偏差的计算方法。还有一种酶动力学研究方法，就是测定随着反应时间的延长，底物浓度的变化，再通过拟合积分以后的米曼方程进行求参。但随着反应时间的增长，酶的活性会发生变化，所以这样测定的浓度，越到后面越不能反应酶的活性。从实验的角度考虑，还是测定系列起始浓度，反应固定时间以后，测定剩余浓度（或代谢物浓度）的方法更靠谱。假定起始浓度为C0，反应t时间以后的浓度变为C1，改变起始浓度C0，我们就可以得到系列的C1。根据积分以后的米曼方程，可以得到C0与C1的关系如下： Integrated Michaelis-Menten Equation (IMM) 这个方程为隐式方程，不能表示为显示方程，也就是y=f(x)这种形式。现有的建模工具，就我所知，都不支持隐式方程的求参，也许存在这样的工具，但我不知道。我直觉上感觉用Excel可以实现，所以在一个月前开始用Excel的Solver和单变量求解工具设计能够对这样的隐式方程求参的算法，大约用了1周多时间，就写好了一个算法。模拟的结果显示，当数据中不含噪音时，可以无偏的求到正确的参数，而一但增加噪音，求参结果就显得非常不可靠，我一度认为这正式IMM的缺点。此外，我还设计另一种与现有的算法（TM）偏差相反的算法PM，希望通过两种算法的平均，达到偏差消除，从而求出正确的解。就在昨天，我还设计了Robustness参数，APDD, APF等参数，通过比较它们之间的大小，自动判断哪种算法获得的结果更可靠。本打算今天下午的Seminar向老板汇报工作，但老板有事外出，Seminar被取消。早知Seminar被取消的话，我这两天就不用那么辛苦赶工了，心里有种极放松的感觉。暂时没有其他的事情，我就在EnzySolver上模拟不同的数据，看看结果如何，可能存在什么规律。突然，我发现前面设计的求解算法有问题，当C1这一列没有噪音的时候，只要一个循环就可以得到正确的解，而当它有噪音时，整个算法Solver仅相当于只迭代一次，怪不得误差会比较大呢。在晚上回家前，终于完成了那个迭代算法，模拟结果显示，即便存在很大噪音，其求的参数总是在各种算法中最接近真实值的，竟然比我用群体的方法（理论上考虑了误差模型）还精确，不可思议。我本来打算用Phoenix的NLME方法作为压轴的终极解决方案呢。我暂不知道我设计这种隐式方程的求参方法是否别人已经发表过，也不知道它是否可以用于其他隐式方程，是否具有通用性，这些都需要后面的工具进一步验证。 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Mass Spectrometry

苯乙基色原酮的裂解第10期：6,7-dimethoxy-2-phenethyl-4H-chromen-4-one

Yufeng Zhang August 1, 2013 0Comments

甲基自由基今天是苯乙基色原酮系列的最后一个化合物，晚上还有重要的任务，需尽快完成今天的更新。 QD-14与第5期的QD-7的B还上均没有取代基，只能发生C11-C12均裂，生成自由基离子，然后质子分别挂在两侧，得到m/z 220和91。QD-14结构上有两个甲氧基，照理应该看到掉甲基自由基的碎片呀，当我用自己2.5的眼找了一遍后，还真发现一个m/z 205，你看到了吗？至此，苯乙基色原酮的系列化合物的裂解规律我们都介绍完毕了，感兴趣的你是否学到一些质谱解析相关的知识了呢？这类化合物的裂解比较简单，以这样的一类化合物开始，比较容易产生成就感，后面我会逐步介绍一些比较难的例子，如果一路看下去，那些难得其实也不难，真正难的是解不出来的！也许后面我该多穿插介绍一下我以前在建模方面的工作，毕竟MS的含义是二重的，而我这段时间又主要再搞建模，有了不少积累，慢慢放出来吧。 MS2 of QD-14 ===================================================== 化合物：6,7-dimethoxy-2-phenethyl-4H-chromen-4-one（QD-14） SMILES: O=C1C2=CC(OC)=C(OC)C=C2OC(CCC3=CC=CC=C3)=C1 InChIKey: MVQOWXHYPYRBOE-UHFFFAOYSA-N 参考文献：10.1002/jms.3242 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Mass Spectrometry

苯乙基色原酮的裂解第9期：2-(2-hydroxy-2-(4-hydroxyphenyl)ethyl)-4H-chromen-4-one

Yufeng Zhang July 31, 2013 0Comments

分子内羟基迁移 QD-22的结构仅比昨天的QD-11少一个甲基，所以它们的MS2看上去非常相似，基峰均为m/z 161。由于B环上的甲氧基变成成了羟基，对应的含B环碎片减少14Da，即m/z 123。比较奇怪的是QD-22多了一个碎片m/z 107。前面介绍的QD-27-1也具有4'-OH，同样生成了m/z 107，可以推测m/z 107与B环的对位羟基有关。经过半个多小时的思索，我构建了一个可能的裂解途径，见上图。质子化的12-OH进攻旁边的1'位，形成环氧中间体，同时质子转移到2'位C原子上；环氧开环，正电荷转移到C12原子；下一步，C-1'上的羟基转移到C-11上，C11-C12键断裂，这时就生成了m/z 107和中性碎片176。这个途径不如C11-C12直接断裂容易，生成的碎片离子的丰度很低。当我想出了这个裂解途径以后，又想到，假如这个途径是正确的，一定存在电荷在A,C环上的碎片离子，正如C11-C12断裂以后，电荷可以分别存在两侧的碎片上，因此应该存在m/z 177的碎片离子（即中性碎片176质子化的碎片）。经仔细观察QD-22的MS2，确实在m/z 177的位置上，发现极弱的信号。当然这也有可能是背景噪音，需要进一步实验验证。 QD-22的MS2 在过去的一个多月中，我在鼓捣酶动力学数据的分析方法，希望找到一种通用的、没有系统偏差的算法。前些日子一直没有进展，昨天学习了群体药动学技术以后，突然领悟到，这个酶动力学测定的实验，可看作大量受试者仅采一个时间点血样的实验设计，这不正是群体药动可以分析的数据吗？！经过简单的数据格式化，今天终于获得了一个比较满意的结果。根据模拟数据的结果，加上噪音后的数据，群体的方法仍可以准确估算参数，大大由于PM, TM, IMM等方法。 ===================================================== 化合物：2-(2-hydroxy-2-(4-hydroxyphenyl)ethyl)-4H-chromen-4-one（QD-22） SMILES: O=C1C2=CC=CC=C2OC(CC(O)C3=CC=C(O)C=C3)=C1 InChIKey: UNNQNQLODLRMBI-UHFFFAOYSA-N 参考文献：10.1002/jms.3242 –EOF– 文章来自，微信号：MS4Fun，不定期发布自己在质谱应用和建模&模拟方面遇到的一些有趣的事情，欢迎分享与推荐。

Breaking

甘草黄酮的裂解(4)：甘草查儿酮B(Licochalcone B)

甘草黄酮的裂解(3)：甘草苷(Liquiritin)

甘草黄酮的裂解(2)：7-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

非线性拟合的一个前提条件：观测变量等方差分布

甘草黄酮的裂解(1)：4‘-O-(beta-D-apiofuranosyl-(1-2)-beta-D-glucosyl)-Liquiritigenin

酶动力学的PML模型

隐式方程的matlab实现：酶动力学（Integrated Michaelis-Menten Equation）的无偏参数求解

酶动力学数据分析工具：EnzySolver 1.0

苯乙基色原酮的裂解第10期：6,7-dimethoxy-2-phenethyl-4H-chromen-4-one

苯乙基色原酮的裂解第9期：2-(2-hydroxy-2-(4-hydroxyphenyl)ethyl)-4H-chromen-4-one

You Missed

Elucidation of Interaction Mechanisms between Irinotecan and Oroxylin A in Rats through Physiologically Based Pharmacokinetic Modeling

Postdoc positions available at CUHK, Hong Kong 香港中文大学博士后岗位

质谱(Mass Spectrometry, MS)与药学研究 (8)

质谱(Mass Spectrometry, MS)与药学研究 (7)