2020年11月9日,中國醫學科學院系統醫學研究中心蘇州系統醫學研究所蔣太交研究員團隊在《Briefings in Bioinformatics》發表了“DeepSSV: detecting somatic small variants in paired tumor and normal sequencing data with convolutional neural network”論文,報道了一個用于識別癌癥相關短序列突變位點的基于深度學習的卷積神經網絡方法。
癌癥研究的終極目標是個體化精準醫療,需要使用識別算法準確判別癌癥相關突變。目前基于統計方法和機器學習方法的識別算法只考慮有限的比對特性,并不能包含潛在突變位點上下游的基因組區域的比對特性,而卷積神經網絡相對于傳統的機器學習算法具有特征學習能力優勢。本研究基于腫瘤和正常細胞測序數據的混合文件,構建一個二維矩陣作為卷積神經網絡模型的輸入,然后用訓練好的模型預測潛在突變位點是否是癌癥相關的突變位點的概率。測試結果表明,相比于基于統計和機器學習的識別算法,DeepSSV的預測性能得到了顯著提高。
圖:DeepSSV工作流程
本研究工作得到中國醫學科學院醫學與健康科技創新工程(2016-I2M-1-005, 2020-I2M-2-003)等項目的資助;蘇州系統醫學研究所蔣太交研究員為論文通訊作者,孟靜博士為論文的第一作者。
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbaa272/5960414?guestAccessKey=4a9111e2-d9d4-44b1-9488-6b07d254fc12