全部 自然 健康 生物 人文 日报 科研干货 文献云
各类科学家汇集一堂,共商癌症治疗大计
来源 : 科学之家   发布时间 : 2014-12-12 17:51

图片来源:scitechdaily.com
 
在一项新研究中,科学家们详述了如何将统计物理学和人工智能融合进一个数学工具包,然后利用这个工具将癌症突变数据转变为多维模型,从而展示特定突变是如何改变细胞中蛋白社会性网络的。
 
尽管这听起来像是一些深夜科学怪人正在勾勾画画,起草研究思路,但研究人员其实已经成功完成上述任务,并将它应用到日益繁琐的现代生物学问题当中,换句话说,就是在日益增长的基因组数据海洋中寻找有用的信息。
 
具体来讲,全基因组研究正在以惊人的速度不断发表数据,其中包括海量的癌症突变数据。现在的挑战就是找到新而有效的方法从“噪声”中解析出“信号”(而且“噪声”源源不断)。
 
为了解决此问题,科学家们将统计物理学和人工智能融合到一个数学工具包中,使得该工具包可以将癌症突变数据转变为多维模型,来展示特定的突变是如何改变细胞中蛋白的社会性网络。通过该工具,科学家们就可以推断出在众多癌细胞突变中,到底哪一些突变才是导致疾病发生的“元凶”。
 
基于统计力学的算法是上述新方法的核心。统计力学是理论物理的一个分支,其能够通过预测微观结构的宏观特性来描述大量的现象。
 
这篇论文的作者之一、哈佛医学院(Harvard Medical School,HMS)系统药理学教授Peter Sorger说:“我们在统计物理学中发现一个基本概念,这个基本概念我们在大学时的理论物理课程中学过,但因为作为生物学家,我们不会经常用到这一概念,因此大部分人都已经将它遗忘了。但是这个基本概念却可以帮助我们解决癌症遗传学中的一个难题。”
 
暗物质很重要
 
现在被广泛研究的癌基因如P53和Ras,都是由众多研究小组通过数十年的努力发现的。但是在今天这个高通量基因组学时代,我们有来自成千上万样本的海量数据。因此,分类成册的癌症突变数量非常大。但是并不是所有的突变都影响肿瘤反应。许多突变都无关紧要,因此也被称为乘客突变(passenger mutation)。为了将司机突变与乘客突变区别开来,研究人员用一种“轮询”(polling)策略来识别最常见的突变,进而推导出这些是最重要的突变。只有最有可能的候选基因才能像P53和Ras那样被加以更详尽的分析。
 
这篇论文的第一作者Mohammed AlQuraishi是一位独立的哈佛医学院系统生物学专家,与LSP和Sorger实验室进行合作。AlQuraishi具有遗传学、统计学和物理学的背景,因此他认为生物学家十分需要更多的生物物理学方面严谨的工具来处理这些数据,并意识到生物学家可以利用实时数据集的统计功效,并将它与理论物理学结合起来。他开玩笑说,这就像是Silver和Feynman所做的那样。
 
统计力学可以从物理上精确描述多个单分子集合体如何产生宏观特性,比如温度和压力。AlQuraishi把统计力学的核心思想作为分析癌症基因组图谱的基础,因此他绘制出了详尽的图表,用来解释特定突变是如何改变纷繁复杂细胞世界的蛋白质社会网络,而这些网络很大程度上决定了一个细胞的健康与否。基于此,他偶然得到一些意外的收获。
 
很多癌症突变是比较常见的,而更多数的癌症突变很少见,有些突变甚至稀有到仅仅发生在极少数病人身上。AlQuraishi发现常见突变和稀有突变影响蛋白质网络的可能性相同。
 
AlQuraishi说:“这两种突变一样强大。在这两种情况下,约1%的常见突变和1%的稀有突变会改变我们研究的肿瘤网络,但是稀有突变很大程度上被直接忽略了,我们需要开始重点关注这些稀有突变。”
 
对于每一个常见突变,总会有大约四个稀有突变与之对应,因此从数量来说,稀有突变可能比我们以前认为的还要重要,因而我们应该进一步研究稀有突变。我们之前一直认为这些大量的稀有突变是暗物质,但是这次我们发现所有的暗物质其实都很重要。
 
复制结果
 
研究人员还发现,突变并不是像他们预期中的那样颇具破坏力。它不会摧毁整个网络分支(如造成整个社区停电),也不会硬生生地表达出一个全新的角色(如一种迥异的蛋白质),突变只会微妙地、几乎手术般精确地改变通讯路径。
 
AlQuraishi说,从突变的角度来看,是很难如此精确的。但是癌症也不能太嚣张,否则它就会被消灭,因而它需要低调行事,这一网络内微调刚好能达到这样的目标。制药公司可以通过研究这个方面,开发出更多的靶向治疗方案。
 
这些发现还能处理的一个问题就是,检查研究是不是在重复那些在科学文献上已发表的发现。在我们的研究中,研究人员能够利用基本的物理原理,来处理不同实验室的数据集(包括他们自己的数据集),以去除假阳性,填充真阳性结果。因此这个模型比其他任何单个数据集更精确,同时可重复利用性更强。
 
AlQuraishi说:“我们可以用建模和实验结果一致的数据来减轻实验量。”
 
Sorger说:“一般来说,科学中无法重复的问题,大多数是因为统计匮乏。我们的研究正好直击要害。”(科学之家,译审:JY Chen)  
 


关注科学之家微信公众号:科学HOME (长按复制) 收取新鲜科学资讯。投稿请点击
下载APP 收藏
相关阅读
癌症 蛋白质 基因
新型血液检测——卵巢癌患者的福音
安吉丽娜•朱莉效应:掀起乳腺癌基因检查狂潮
治疗阿尔茨海默病或有新突破
免疫系统——对抗癌症的最佳战友
发现与人类癌症的预后有关的免疫细胞
点击进入 [ 健康 ] 频道 >
推荐文章
词汇量上不去怎么破?剑桥博士带你走出单词学习的几个误区
高校去行政化,这块难啃的骨头上到底附了多少肉?
在读女博士生养孩子历险记:双重压力下,文章发了Nature