热搜: 食品  烟台  奶粉  海产品  保健品  周黑  黑窝点  黑作坊  全聚德  小龙虾 
 
当前位置: 首页 » 检测应用 » 分析应用 » 生命科学应用 » 正文

科学家已找到大数据中提取有用数据的方法 用于代谢组学的研究

放大字体  缩小字体 发布日期:2017-11-01
核心提示:以前,科学家对人类基因组中的基因数量进行了猜测。一些科学家笃定基因数量范围是在100,000个以上。在圣路易斯安娜州的华盛顿大学医学院麦当劳基因研究机构猜测人类基因的最低数量为25,947。如果一旦人类基因组序列完成,这些猜测都能还原其真实性。
   

     图解:代谢组学数据关联十分复杂。但现在或许不像以前那么复杂了。来自华盛顿大学科学家可以将复杂度下降到右图所示程度。来自:Gary Patti实验室
 
  以前,科学家对人类基因组中的基因数量进行了猜测。一些科学家笃定基因数量范围是在100,000个以上。在圣路易斯安娜州的华盛顿大学医学院麦当劳基因研究机构猜测人类基因的最低数量为25,947。如果一旦人类基因组序列完成,这些猜测都能还原其真实性。
 
  近15年之后的现在,华盛顿大学的科学家发现了新型大数据类别称之为代谢组学。据他们估计,一组数据中所含的代谢组数量仅为以前所估计的数据量的10%甚至不到。该研究于9月15日发表在分析化学期刊的网站上。
 
  像以往的基因组测序一样,代谢组学试图分析所有这些存在于样本中的代谢物。但是与基因测序不同的是,代谢物不是由相同的物质块所构建,具有更多的化学多样性。我们所熟悉的代谢物比如葡萄糖和胆固醇等分子,大部分都是饮食的产物。因此,试图确定人类代谢物的确切数量一直就是一个十分艰巨的挑战。由于它对人类所摄入养分的过分依赖,一些科学家甚至认为这并不能算作一个相关问题来进行研究。
 
  科学家们对研究人类代谢物的兴趣几乎和研究人类健康的兴趣一样。最具代表性就是人类对糖尿病的分析研究大概可以追溯到几个世纪之前。从20世纪60年代之后,对其他代谢物的检测已经被用来诊断一些被广泛称为“先天性代谢错误”的疾病。所以代谢组学便是试图测量所有人类产生的代谢物等等。但是最大的问题是:有多少种代谢物需要我们来测量?
 
  随着质谱仪这类复杂设备的出现,代谢组学的研究方式也在发生变化。这些仪器就像很微小的器械一样可以测量像糖一样的分子的重量。通过使用数据库和计算机,科学家可以把测量的重量转换成化合物的名称,如葡萄糖。
 
  十年前,当代谢组学逐渐成为主流时,科学家惊奇的发现典型代谢组学试验中的信号数量大大超过了生物化学教科书中已知的代谢物数量。
 
  艺术与科学化学副教授兼该研究的资深负责人加里?帕蒂(Gary Patti)说:“当然,我们自然而然的假设数据库中没有返回匹配的大部分信号对应于未知的代谢物。”
 
  这种假设的含义是重大的:意味着目前有成千上万种代谢物没有被发现,比您的新陈代谢综合图中所包含的数量更多。
 
  Patti实验室的博士后研究员Nathaniel Mahieu表示:“代谢组学检测中发现数以万计的信号是很正常的,目前为止,还没有发现任何实验中只有1,000到2,000个信号的。”
 
  Patti说:“其中最为关键的问题就是:所有这些代谢组学信号实际上对应的代谢物有多少?”
 
  Mahieu和Patti上周宣布,他们首次获得了美国国家卫生研究院8年共计588万美元的环境卫生资助,开发了新的实验和计算方法来研究代谢组学数据。而且得出一个惊人的结论,他们发现,典型的代谢组学分析中的代谢物的实际数量可能是前面提到的十分之一,剩下大部分数据来自“噪声”。数以千计的信号来源于污染,人造物和被称为“简并”的东西 - 这便使得一种代谢物出现了许多不同的信号时。研究小组还发现,一些代谢物显示为150多个信号。
 
  Mahieu说:“事实证明,我们在大肠杆菌数据中看到的超过90%的信号基本上是噪音,这大大减少了我们之前所认为的未知代谢物的数量。”
 
  Patti说:“我认为这从现实角度提醒了我们代谢组学所研究的不同重量的代谢物并不能认为他们是不同代谢物。同时我相信这也是一件好事情,这意味着我们对代谢组学的认识更进一步。”至于下一步,Patti的实验室打算将其技术扩展到人体样本。“最终目标是对人类进行类似的实验,”Patti说。 “我们这里的工作向前迈出了重要一步。”
 
  那么所有这些噪声信号对其他进行代谢组学研究的科学家有什么意义呢?Patti实验室已经开始在名为creDBle(creDBle.wustl.edu)的数据库中建立“引用数据集”。他们希望这已举措能够促进其他研究代谢组学科学家的实验。
 
  Mahaeu说:“代谢组学目前的研究方式效率十分低下,我们浪费了大量的时间来破译最小的生物鉴别信号,我们希望creDBle中的这些参考数据集能够帮助科学家避免一再反复的识别相同的噪声信号,而且我们已经对那些信号进行了注释。”
 
 
[ 检测应用搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 
0条 [查看全部]  相关评论

 
推荐图文
推荐检测应用
点击排行
  

鲁公网安备 37060202000213号