热搜: 食品  烟台  保健品  海产品  周黑  奶粉  黑窝点  黑作坊  全聚德  小龙虾 
 
当前位置: 首页 » 检测应用 » 分析应用 » 生命科学应用 » 正文

机器学习:正在改变合成生物学的进程

放大字体  缩小字体 发布日期:2017-12-05
核心提示:你最近访问过社交媒体,还是使用数字流媒体服务?如果您有,那么您的这些服务的经验很有可能通过机器学习得到了增强。机器学习是一种计算机编程,计算机可以在复杂的情况下通过获取大量的信息来学习适当的反应。然后,它使用这些信息在提出新问题时做出决策。
   你最近访问过社交媒体,还是使用数字流媒体服务?如果您有,那么您的这些服务的经验很有可能通过机器学习得到了增强。机器学习是一种计算机编程,计算机可以在复杂的情况下通过获取大量的信息来学习适当的反应。然后,它使用这些信息在提出新问题时做出决策。
 
  机器学习在我们的日常生活中已经很普遍了。像Spotify这样的音乐流媒体服务会关注你喜欢听的歌曲,而这些信息可以用来控制播放列表,其中包含你喜欢的新音乐。另一方面,电动汽车制造商特斯拉(Tesla)使用机器学习来教他们的汽车如何驾驶。在人们意识到问题出现之前,你可能已经在网上看到了特斯拉汽车对道路上的危险做出反应的视频。
 
  谷歌工程师Alexander Mordvinstev的深层梦想算法:机器学习是用来教计算机一个给定的图像集,然后计算机将发现和增强这些图像的任何部分,在任何照片,创造迷幻数字艺术。左边是水母的图像,右图是与动物和建筑图像训练的深度梦算法增强的图像。来源:开始。作者:MartinThoma吗?
 
  贝德布鲁克和杨等人最近在加州理工学院的实验室进行了一项研究,他们将机器学习引入合成生物学。该团队将机器学习应用于蛋白质工程的挑战,特别是一种被称为“通道红质”的完整膜蛋白的工程。通过教计算机了解这种蛋白质结构与其功能之间的关系,研究小组能够从他们的序列中预测出通道蛋白的性质,并利用这一功能来实现完全新的蛋白质变异的工程。
 
  通道红质是重要的生物医学研究工具,是应用合成生物学的一个重要例子。在自然界中,通道红质是光合微生物的“眼睛”。这些蛋白结合在藻类的外层,形成微小的通道,利用光和类似于维生素a的分子来打开和关闭,控制离子粒子进出细胞的流动。
 
  2005年,研究人员,包括神经系统科学家埃德·博伊登(Ed Boyden),冯章现在的CRISPR名声和Viviana Gradinaru,在斯坦福大学的Karl Deisseroth教授的实验室工作,表明当通道蛋白被设计成在动物的神经细胞中表达时,神经元的冲动可以被光激活!这是因为神经冲动是一种电信号,通过离子通道的连锁反应来传递神经元。表达的通道蛋白充当了这个连锁反应的启动马达,使研究人员能够控制神经冲动。
 
  什么?
 
  像这个图像中的神经元一样,神经元的脉冲可以通过人工合成的海藻通道蛋白源激活:wikicommons。作者:Methoxyroxy吗?
 
  这一发现揭开了光遗传学的整个领域——利用光来控制和研究活细胞。今天,光遗传学正在被用来控制在自由活动的动物中的神经元,并提供了关于我们的大脑如何在神经元层面上连线的深刻见解。光遗传学已经开始解开诸如自闭症和精神分裂症等疾病的重要神经回路特征。
 
  在阿诺德实验室的新研究中,作者描述了通道旋光蛋白在光遗传学领域也是有问题的。蛋白质必须被整合到膜中,并将其定位到正确的位置。为了获得所需的蛋白质,细胞必须经历一个复杂的蛋白质折叠和多步骤贩运过程。

  此外,只有少量的天然的、具有良好特征的通灵多发质存在,而且它们通常只产生微弱的信号,容易被灭活,或者有一个有限的波长光谱来激活。因此,想要通过制造新的分子来改进光能遗传专家的工具,通过建立强大的细胞贩运、新颖的活动或改进的功能来改进光能遗传专家的工具。
 
  到目前为止,这些蛋白质的工程已经很困难了。一旦研究人员试图改变该通道的氨基酸序列,定位或活动就会受损。很明显,蛋白质的复杂的贩运过程受到氨基酸序列及其三维结构的影响,往往是不可预测的。
 
  Bedbrook和他的同事们通过机器学习解决了这个复杂的问题。
 
  阿诺德实验室的成员参与了这项研究。左至右:Austin Rice,Claire Bedbrook,Kevin Yang?
 
  他们询问是否可以使用channelrhodopsin的序列和结构来有效地教计算机如何预测蛋白质是否能正确地定位并表达良好。
 
  为了完成这项研究,研究人员首先必须建立一个训练数据集,描述通道蛋白氨基酸序列和通道蛋白表达和定位之间的关系。
 
  在之前的研究中,Arnold的实验室使用了一种叫做结构引导的模式重组的方法来生成一个巨大的channelrhodopsin变量序列库。这个过程使用一种叫做图式的算法来寻找蛋白质序列的块,如果换掉的话,不太可能破坏蛋白质折叠,以及扩展损伤蛋白质功能。这些最理想的序列在三种不同的通道间被打乱。研究小组使用了来自Twist Bioscience的下一代DNA合成来构建大约200个新的通道蛋白,并在表征中显示出许多新的蛋白具有良好的定位。(Frances Arnold是Twist Bioscience科学顾问委员会的成员。)
 
  结构引导的模式重组允许形成巨大的序列变异库,其中每个蛋白质的变体有很高的表达和活动的可能性。从Bedbrook等人到2017年的数据?
 
  然后,研究小组将这些序列进行比对,同时测量氨基酸序列的相似性和结构相似度,绘制出序列与函数关系的详细地图。这200个序列的活动、相似性和结构信息构成了数据集,它们将对模型进行训练。
 
  一旦训练完成,他们的模型可能需要一个脑细胞的氨基酸序列,和输出的预测序列将显示是否好或坏的表情,好或坏的定位和正确的本地化水平的氨基酸序列将显示,所有基于模型所了解sequence-function关系。
 
  接下来,研究人员试图探索其模型的准确性。通过将新一代的DNA合成从扭曲的生物科学中提取出来,生成一组被预测有一系列属性的通道,并在经验上测试它们的属性,团队生成了一个新的数据集,也描述了序列-函数关系。在随后的一轮训练中,这种验证的结果被反馈到模型中。
 
  这是机器学习的迭代性质,当计算机对自己的性能有更多的了解时,计算机预测的准确性就会不断提高。团队制作的最终模型能够准确地预测出原始图式库中的哪些序列将具有非常高的正确定位率,从而成为光遗传学的有用蛋白质。令人震惊的是,只有百分之五的原始图书馆会显示出令人满意的属性,因此强调了机器学习的重要性,因为在工程中需要复杂的酶,比如通道,谁对功能的要求是高度复杂的。
 
  采访时该研究的作者凯文·杨说,这个机器学习模型工作以及最终产品“智能而不是随机选择的基因突变,接着说,他的团队希望”会有一个移动到机器学习在社区的使用,特别是当其他形式的蛋白质工程不可能”。

  克莱尔·贝德布鲁克还讨论了“扭曲生物科学”的下一代DNA合成是如何使他们的研究成为可能的:“如果我们用传统的方法来构建我们在这项研究中使用的序列,克隆将花费相当长的时间。”我们必须独立地构造每个序列。它不会是可能的。Twist Bioscience提供高通量的DNA合成,可以购买预克隆,并随时准备从包裹中直接使用。
 
  杨继续说,“机器学习是迭代的,因此很多序列必须定期生成,我们在这个研究中使用了大约300个序列。”任何我们的模型预测的,我们都可以用扭曲的生物科学来做。最后,Bedbrook提到了“从扭曲生物科学中得到的事实序列已经证实,我们可以绝对确信我们测量的任何属性都与它的序列有直接关系,”这是这种方法的一个基本属性。
 
  毫无疑问,这项研究具有开创性,无论是对于光遗传学还是蛋白质工程。贝德布鲁克和杨说,他们已经开始在神经元中测试他们新研制出来的一些新合成的通道蛋白,初步结果看起来很有希望!机器学习对于合成生物学来说是非常新的,只有少数几个已发表的例子。然而,这项研究背后的团队已经证明,在下一代DNA合成的帮助下,机器学习将成为蛋白质工程在不久的将来的一个完整的应用。
 
 
[ 检测应用搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 
0条 [查看全部]  相关评论

 
推荐图文
推荐检测应用
点击排行
  

鲁公网安备 37060202000213号