理解生物分子中的结构-功能关系,这是生物物理学的圣杯,也是生物学中反复出现的挑战。数学仪器,包括单形几何、微分几何、微分拓扑、代数拓扑、几何拓扑学、纽结理论、光谱图理论和拓扑图,对于破译这些关系都是必不可少的[1]。几何建模弥补了生物数据与数学模型之间的差距,是生物分子及其相互作用概念化的首要问题。拓扑极大地简化了生物复杂性,并将有洞察力的高层抽象呈现给了生物数据(参见图1)[2,3]。图论可以超越拓扑连通性,采用谐波分析和优化理论来探索生物分子结构-功能关系。
图1所示。基本的simplexes(左)和蛋白质持久条形码(右)。图片来源:Zixuan仓。
生物有机体的一个显着特征是其多尺度性质和巨大的复杂性。细胞内的细胞器、分子机器以及生物分子在活体组织中的动力学和转运——如膜转运、信号转导、转录和翻译——对细胞功能至关重要,不能简单地用无原子或分子自由的现象学模型来描述。然而,在原子尺度上,这些系统有着难以控制的自由度。采用量子力学(QM)、分子力学(MM)和连续力学(CM)的多尺度建模与分析,可以有效地降低其维度[4,5]。曲面的微分几何理论产生了微观和宏观域之间的自然分离[6]。偏微分方程(PDEs)(如:薛定谔方程、泊松-玻尔兹曼方程、弹性方程等)、牛顿运动方程、变分分析、均化、微分几何、持久稳定流形等,支持过大的生物系统的多尺度QM /MM/ CM建模[6,7]。可以利用守恒律、随机分析和不确定度量化来揭示个体生物分子行为与实验测量的关系。
研究人员没有充分了解各种大分子复合物如何相互作用并产生细胞功能和生物途径,例如代谢、遗传和信号转导途径[8]。微分方程、组合学、概率图、随机矩阵、统计模型和代数几何是描述交互式生物网络的主要工具,如蛋白质相互作用、基因调控和酶动力学网络。系统生物学方法经常涉及到机械模型,如通量平衡分析和化学动力学,从它们的基本构造块的数量属性重建动力系统。结构生物信息学和计算生物物理学预测生物网络的反应通量、速率和平衡常数。利用几何、拓扑学和图论的数学方法在结构生物信息学中具有竞争优势[9,10]。
在后组学时代,高通量测序策略的可用性导致了基因组学、蛋白质组学和代谢组学。组学的目的是对一组生物分子信息进行综合研究,从而转化为生物体的结构、功能和演化。一个主要的挑战来自于预测基因组学来自基因的帮助和/或特征信息。另一个挑战是理解基因组的进化,因为基因和基因-环境的相互作用。统计方法——如纵向研究、因果分析、统计推理、模糊逻辑、促进和回归——在分析经济数据集方面起着至关重要的作用。机器学习是揭示基因型到表现型映射的另一个有力工具。
精确、高效、健壮的计算算法、方法和方案的开发是实现生物建模、分析和预测的数学方法的先决条件。数值方法在求解PDEs问题上的重要性逐渐得到生物学界的重视[11,12]。计算几何是结构生物学和生物物理学的一个重要方面。计算拓扑学分析了复杂生物分子的有趣拓扑结构,如蛋白质的拓扑不变性和核小体和染色体的结不变性[13]。高效图论算法的发展对生物分子结合的描述至关重要[14]。
合理的药物设计是一个重要的生命科学问题,最终检验我们对生物系统的理解。设计有效的治疗疾病的药物是生物科学中最具挑战性的任务之一。数学在热点预测、药物分析、结合亲和预测、结构优化、毒性分析、药代动力学模拟等方面起着至关重要的作用。例如,在D3R Grand Challenge 2中,机器学习与多尺度加权彩色图形和多组件持久同源性的集成提供了最佳的自由能排名,在D3R Grand Challenge 2中,这是一个计算机辅助药物设计的世界性竞争。预计未来十年大多数新药将由人工智能发起。
引用
[1]夏,K.L.(2016年)对生物分子数据建模和分析的几何、拓扑和图论的综述。(q-bio arXiv:1612.01735。BM),1 - 76。
达西[2],I.K.,Vazquez,m .(2013)。确定稳定蛋白- dna复合物的拓扑结构。生化社会交易,41,601 - 605。
[3]Heitsch C。(2014年)。对rna二级结构的组合洞察。《分子生物学》中的离散和拓扑模型,145 - 166。
[4]艾森伯格,狗屁、Hyon Y.K.刘谦(2010)。水和通道离子的能量变分分析:复杂离子流体原始模型的场论。化学物理学报,133,104104。
[5]贝克,K。陈,D。蔡国强(2016)。在分子动力学模拟中,通过图像电荷溶解法(ICSM)对KcsA通道的选择性进行了研究。计算物理中的通信,19,92 - 943。
[6],G.W.(2010)。基于微分几何的多尺度模型。数学生物学公报,72,1562 - 1622。
[7]周,Y.C.霍尔斯特,M.J.,McCammon,J.A.(2008)。由静电力引起的大分子构象变化的非线性弹性模型。数学分析与应用杂志,340,135 - 164。
[8]Komarova N . . L。邹,X。聂问。,Bardwell,l(2005)。细胞信号特异性的理论框架。
分子系统生物学,1(1)。
[9]Demerdash O.M.A.每天,医学博士,Mitchell,J.C.(2009)。基于结构的变构热点预测模型。PLOS计算生物学,5,e1000531。
[10]沧,Z.X.(2017)。拓扑结构:基于生物分子属性预测的基于深度卷积和多任务神经网络的拓扑结构。Plos计算生物学,13(7),e1005690。
赵[11],美国(2012年)。仿生分子表面表示法和溶剂化分析的伪时耦合非线性模型。生物医学工程数值方法国际期刊,1964 - 1981年。
耿[12],诗人,& Krasny,r .(2013)。一种treecode -加速边界积分的泊松- boltzmann求解器,用于溶剂化生物分子的连续静电学。j .第一版。理论物理。,247,62 - 87。
[13]重,T。(1992)。用分子动力学模拟的超螺旋DNA发现的三叶结。科学,257(5073),1110 - 1115。
[14]阮号肖,T。王,马丁(2017)。刚性增强:一种蛋白质配体结合的机制。化学信息与建模杂志,57,1715 - 1721。
感谢密歇根州立大学(Michigan State University)数学教授郭伟伟(guo -Wei Wei)。