PhenoApt leverages clinical expertise to prioritize candidate genes via machine learning通过机器学习算法利用临床专业知识确定候选基因的优先顺序(Chen Z, Zheng Y, Yang Y, Huang Y, Zhao S, Zhao H, Yu C, Dong X, Zhang Y, Wang L, Zhao Z, Wang S, Yang Y, Ming Y, Su J, Qiu G, Wu Z, Zhang TJ, Wu N. PhenoApt leverages clinical expertise to prioritize candidate genes via machine learning. Am J Hum Genet. 2022 Feb;109(2):270-281.)近年来,外显子组测序在孟德尔疾病的诊断中展现出巨大的应用价值。然而,即使经过了严格的筛选,典型的外显子测序分析仍然需要对数百个变异进行解释,这一过程极大地阻碍了对致病基因的快速识别。由于对外显子测序数据的解释需要综合临床分析,将临床专业知识考虑在内可以加快孟德尔疾病的分子诊断。为了利用临床专业知识来确定候选基因的优先级,我们开发了表型驱动的基因优先级排序工具PhenoApt,该工具通过机器学习算法允许用户为每个表型分配特定权重。利用将致病基因排在前10位的能力作为评估指标,基线分析表明,在三个独立真实的多中心队列中(队列1,185人;队列2,784人;队列3,208人),PhenoApt的表现比之前的一些表型驱动的基因优先排序工具相对提高了22.7%-140.0%。另一试验表明,通过增加临床主诉(应由致病基因解释)的权重,在队列2 (471人)和队列3 (208人)中, PhenoApt的性能分别相对提高了37.3%和21.4%。此外,利用tf-idf(词频-逆文本频率)法,PhenoApt可以根据其为孟德尔性状的可能性为每个表型分配一个固有权重。当临床主诉被赋予固有权重时,PhenoApt的表现在队列2和队列3中分别相对提升了23.7%和15.5%。为了使PhenoApt融入临床实践,我们开发了一个用户友好的网站和一个命令行工具。