新的Metascape平台使生物学家能够解锁大数据洞察
LA JOLLA,CALIF。- 2019年4月3日 - 对于现代生物学家来说,大规模的OMICs研究 - 它们映射了生物系统背后的所有基因,蛋白质,RNA等 - 是该行业的标准工具。但解释这些大数据输出以生成有意义的信息远非常规:分析结果需要复杂的工具和训练有素的计算科学家。即使对于专家来说,这些努力也是代价高昂且耗时的 - 需要花费数天到数周才能生成可操作的信息。
现在,来自Sanford Burnham Prebys,诺华研究基金会(GNF)基因组学研究所和加利福尼亚大学圣地亚哥分校的科学家们已经发布了一个基于网络的开放式门户网站,它集成了40多种先进的生物信息学数据源, - 技术用户只需点击一下即可生成见解。该工具称为Metascape,它消除了数据分析障碍 - 允许研究人员将更多时间花在重要的生物学问题上,减少构建和排除数据分析工作流程的时间。该平台今天在Nature Communications中有所描述。
“生物学家寻求解决当今一些最具破坏性的疾病 - 从癌症到阿尔茨海默病,再到感染性疾病,如艾滋病毒或流感(流感),”Sumit Chanda博士说。该研究的高级作者,桑福德伯纳姆普雷比斯的免疫和发病机制项目主任。“通过开发Metascape,我们希望帮助生物学家更好地了解他们自己的数据,以便他们能够发现能够导致新疾病目标,改进疫苗和治疗具有挑战性疾病的新药的信息。”
该研究的第一作者,GNF的数据科学和数据工程主任周英耀博士补充道,“即使对于计算科学家来说,编译和分析大型OMIC数据集也是一项艰巨而耗时的任务.Metascape为生物学家提供了支持。通过一个平台,他们可以在一个简单的界面中访问众多分析工具的强大功能,并生成易于理解的报告。“
在论文中,研究人员使用三个先前发表的流感遗传屏幕详细介绍了Metascape的特征和功能,这些流感筛查旨在寻找与病毒复制有关的因素。在其工作流程中,Metascape集成并分析了来自40多个常见模型生物的40多个流行的开放存取数据库中的信息,以便在大约一分钟内生成易于理解的报告(更大的数据集可能需要更多时间)。
“Metascape已经在超过330项已发表的科学研究中促进了对大型OMIC数据集的分析和解释。由于其易用性,我们预计它将很快成为一个不可或缺的平台,有助于科学家在大时代破译关键结果数据,“Sanford Burnham Prebys的研究作者和研究助理教授Lars Pache博士补充道。
基本分析选项,利用常用的分析实践;或者高级分析,它可以控制个人设置。自动生成PowerPoint演示文稿,Excel文档和其他可视化报告工具,以促进结果的交流。为确保Metascape的数据尽可能保持最新,研究人员采用了两阶段方法,该方法利用自动爬行数据源的机器人,然后进行手动质量控制。
接下来,科学家们正在转向人工智能,以加深Metascape可以提供的见解。“通过将新的机器学习工具应用于Metascape,我们可以帮助生物学家发现他们数据中的更多细微差别,帮助科学家更好地优先考虑他们想要进行研究的方向,”周说。