“超快速,可扩展且高度准确”的分类系统使用新的基于图形的专用软件和决策树方法来说明分类,并从所有可能的结果中找到最佳选择,整个方法使用基于新图形的专用软件来说明所有测试的可能结果中的最佳选择。生物学教授凯瑟琳·希尔(Kathleen Hill)与计算机科学,统计与精算科学领域的西方合作者以及滑铁卢大学计算机科学系的其他人共同领导了这项研究。
机器学习方法可实现COVID-19序列的100%准确分类,更重要的是,可在数分钟内再次发现5,000多个病毒基因组之间最相关的关系。
“我们需要的是COVID-19 DNA序列来发现其自身的内在序列模式。我们使用该签名模式和一种逻辑方法,使该模式与其他病毒尽可能接近,并在数分钟内达到了很好的分类水平,而不是天,而不是数小时,而是数分钟,”希尔说。
该分类工具已被用于分析5,000多个独特的病毒基因组序列,包括1月27日可用的29个COVID-19序列。
希尔认为,该工具能够对任何新发现的病毒序列COVID-19进行分类,否则将成为全球大流行期间疫苗和药物开发人员,一线医疗工作者,研究人员和科学家使用的工具包的重要组成部分超越。
来源:Gurjit S. Randhawa et al. Machine learning using intrinsic genomic signatures for rapid classification of novel pathogens: COVID-19 case study, PLOS ONE (2020). DOI: 10.1371/journal.pone.0232391
来源:Gurjit S. Randhawa et al. Machine learning using intrinsic genomic signatures for rapid classification of novel pathogens: COVID-19 case study, PLOS ONE (2020). DOI: 10.1371/journal.pone.0232391