新方法揭示了隐藏的进化历史

rabadan_birdflu-diagram
在应用于流感病毒基因组数据时,这项技术揭示了一种新病毒的起源,这种病毒今年早些时候在中国引发了疫情。新型H7N9病毒(顶部多面体)是由在鸟类中发现的其他三种流感病毒混合而成的。

一项将基因组学和数学领域的代数拓扑结合起来的新技术可以迅速揭示生物的复杂进化——在不同的进化规模捕捉基因流动——这将帮助科学家更好地理解大流行病毒的起源、细菌中的基因转移、真核生物中的杂交物种(细胞含有一个膜包核的生物体),以及人类的迁移。

这项技术是由劳尔·拉巴丹,博士,系统生物学和生物医学信息学助理教授;医学博士/博士生陈若志;斯坦福大学的数学家贡纳·卡尔松(Gunnar Carlsson)捕捉到了许多被其他方法遗漏的进化过程。这篇文章发表在11月12日的《纽约时报》上美国国家科学院院刊。

基因组可以被看作是代表进化的高维空间中的点。代数拓扑计算这些空间的简单、健壮的对象,可以映射到标准的进化过程。

这些空间中最简单和最标准的是系统发育树,这是代表物种进化史的标准方式。然而,一棵树无法捕捉不同生物体之间的基因组信息交换,这是病毒、细菌和一些真核生物普遍存在的现象。这项新技术以数学结构显示这些事件,该结构捕获了三个关键因素:基因组物质交换的类型、交换的频率以及它们发生的进化规模。

病毒的进化尤其难以研究,因为不同的病毒株经常交换和合并其基因组的一部分。将这项新技术应用于流感病毒的基因组数据,研究人员能够发现标准系统发育分析无法发现的复杂基因交换模式。在今年早些时候中国爆发的禽流感案例中,研究人员能够迅速发现责任病毒的来源,这是由在鸟类中传播的三种不同病毒的复杂混合造成的。

这项工作是一项雄心勃勃的计划的第一步,该计划将进化与基于基因组数据的代数拓扑联系起来。随着数学和生物学方面的快速发展,这项工作正在扩展到包括人类在内的许多其他物种。

要阅读更多关于这项技术的信息,请参见“进化建模的拓扑方法,“在系统生物学系新闻页面。

主题

标签

流感,劳尔·拉巴丹,病毒