识别病毒株中致病基因的新方法一目了然
当新病毒或细菌传播给人类时,必须尽快阐明其特殊特征。例如,为什么冠状病毒对普通药物有抗药性?将来,新的大数据技术可以帮助您在短时间内识别出新的病毒和细菌菌株的特征。它通过将单个生物的基因组与一个物种的所有菌株的基因组进行比较来做到这一点。此过程也可用于高度发达的生物,例如哺乳动物。比勒费尔德大学的新项目“ Pangaia”正在研究如何对在此过程中使用的大量数据进行排序和分析,以用于生物医学。该大学是来自欧洲和北美的11个项目合作伙伴之一。欧盟将在三年内向该项目提供114万欧元的资金。
当生物医学科学家想要找出生物的遗传物质是否显示出特定的变异时,他们通常使用参考基因组。它们以显示整个物种典型特征的方式组合了多个基因组。这使研究人员能够将新的流感病毒与参考基因组进行比较,该参考基因组概述了其起源的病毒株的典型特征。
在这些情况下,我们仅将两个基因组相互比较-差异和相似性在计算机上相对容易识别。使用新方法,我们可以在一个步骤中将一个基因组与数千个其他基因组进行比较。”
自2020年1月起担任基因组数据科学工作组负责人的技术学院的亚历山大·舒恩胡斯(AlexanderSchönhuth)教授说:“到目前为止,计算机辅助的泛基因组学的问题一直是由于海量数据导致的透明度不足。”他正在协调比勒费尔德的Pangaia子项目。像詹斯·斯托耶(Jens Stoye)一样,他和他的团队正在比勒费尔德大学的生物技术中心(CeBiTec)进行研究。
遗传数据用字母A,C,G和T表示。这些代表核苷酸,即遗传物质的组成部分。基因组可以由数十亿个这样的信息单元组成。为了使它们更易于比较,可以将它们彼此相邻显示为“字母链”。这种传统的基于序列的表示法如今已广泛使用。Schönhuth说:“但是,由于有数百个比较基因组,需要花费大量时间才能逐步分析所研究的基因组与每个比较基因组的差异。”
这项新技术可以对同一生物的许多菌株进行同时,整合的分析。这些可能是病毒,细菌,有时甚至是高等生物。” Jens Stoye解释说。``这使得可以强调单个成员之间的异同。就病原体而言,通常甚至有可能理解和预测导致特别是感染性菌株发展的过程。这项技术还可以用于检测人类的遗传性疾病或确定肿瘤中的哪些突变导致了强烈的异常生长。
Schönhuth说:“在接下来的几年中,我们希望与我们的项目合作伙伴一起开发新的算法和数据结构,以使计算机辅助的泛基因组学更快,更友好。”一个目标是开发用于变异图的算法。通过这些程序,计算机可以搜索比较基因组之间的相似性和差异,并以图形方式显示结果:“变异图可以快速,高分辨率地区分病毒的致病性和无害变体,”Schönhuth说。尤其是,它们还使我们能够鉴定出完全新颖的突变,例如那些可能在目前在中国流行的冠状病毒变种中发生的突变,并导致了对常规药物的耐药性。”
Pangaia项目的全名是“泛基因组图算法和数据集成”。它的运行时间为2020年1月至2023年12月。欧盟通过其Horizon 2020研究框架计划资助Pangaia,米兰大学(意大利)正在协调该项目。除了比勒费尔德大学以外,其他合作伙伴还有:荷兰科学研究组织(NWO),布拉迪斯拉发夸美纽斯大学(斯洛伐克),Geneton(斯洛伐克)和Illumina Cambridge(英国)生物技术公司,巴斯德研究所(法国),西蒙·弗雷泽大学(加拿大),东京大学(日本),康奈尔大学和宾夕法尼亚州立大学(均为美国)。