机器学习工具可以预测动物王国中的病毒库
许多致命的和新出现的病毒如埃博拉病毒和寨卡病毒在传播给人类并导致严重疾病之前很久就在野生动物和昆虫群落中传播。然而,找到这些天然病毒宿主 - 这可能有助于防止向人类传播 - 目前对科学家们构成了巨大的挑战。
现在,一种新的机器学习算法被设计为使用病毒基因组序列来预测广谱RNA病毒的可能天然宿主,这些病毒群最常从动物跳到人类。
这项由格拉斯哥大学领导并于今天发表在“科学”杂志上的新研究表明,这项新工具可以帮助预防针对致命疾病的预防措施。科学家们现在希望这种新的机器学习工具能够加速研究,监测和疾病控制活动,以针对野外正确的物种,最终目的是防止致命和危险的病毒进入人类。
从基因组序列中寻找不同病毒的动物和昆虫宿主可能需要多年的密集的实地研究和实验室工作。由此引起的延迟意味着难以实施预防措施,例如接种动物疾病源或防止物种之间的危险接触。
研究人员研究了500多种病毒的基因组,以训练机器学习算法,将病毒基因组中嵌入的模式与其动物起源相匹配。这些模型能够准确地预测每种病毒来自哪个动物宿主,病毒是否需要叮咬血液喂养载体,如果是这样,载体是蜱,蚊子,蚊子还是白蛉。
接下来,研究人员将这些模型应用于宿主和载体尚不为人所知的病毒,如克里米亚刚果出血热,寨卡和MERS。模型预测的主机经常确认每个领域目前最好的猜测。
令人惊讶的是,四种被认为具有蝙蝠水库的埃博拉病毒中的两种实际上具有与灵长类病毒相同或更强的支持,这可能指向非人类灵长类动物,而不是蝙蝠,是一些埃博拉病毒爆发的来源。
来自格拉斯哥大学病毒研究中心的MRC研究的高级作者Daniel Streicker博士说:“基因组序列只是病毒出现时可用的第一条信息,但直到现在它们已被大多用于识别病毒并研究它们的传播。
“能够利用这些基因组来预测病毒的自然生态,意味着我们可以迅速缩小对动物宿主和病媒的搜索范围,这最终意味着可能会阻止病毒一起出现或阻止其早期传播的早期干预措施。”
来自Wellcome的感染和免疫生物学团队的Pete Gardner博士说:“健康的动物可携带病毒,可以感染导致疾病爆发的人。发现动物物种经常具有难以置信的挑战性,因此难以实施预防措施,如接种动物或防止动物接触。
“这项重要的研究强调了将机器学习和遗传数据结合起来以快速准确地识别疾病的来源以及如何传播疾病的预测能力。这种新方法有可能迅速加速未来对病毒爆发的反应。”研究人员正在开发一种网络应用程序,使世界各地的科学家能够提交病毒序列并快速预测水库宿主,载体和传播途径。