论文部分内容阅读
随着计算机技术的迅猛发展,人们对大规模计算的处理逐渐变得可行。以统计学和计算机科学为基础发展起来的机器学习理论正快速被应用到各个领域。这给生物信息学这个生命科学的热点研究领域之一的学科带来了前所未有的机遇与挑战。不仅随着新一代测序技术的不断进步和广泛展开,基因组数据获得了广泛的、空前的积累,而且随着人们对于计算机处理数据能力的认识,临床医学数据也得到了有效的规范化的大量积累。随着人们对问题研究的需求不断深入,人们开始应用现代大数据处理技术来研究或者辅助研究复杂的疾病。在本文中,我们正是利用这样的时代机遇来接受一个可观的挑战,即我们将利用肌萎缩性脊髓侧索硬化症临床医学数据对其进行研究,试图推动一些临床应用上的进步。本文的主要研究成果如下: (1)通过对肌萎缩性脊髓侧索硬化症临床医学数据进行分析和整理研究,我们重新构造了一些重要特征,并利用这些特征对肌萎缩性脊髓侧索硬化症病人进行了亚型划分。通过统计学习手段对所涉及的特征进行了深入分析与提取,最终我们对每一类亚型病人提取了少量本质特征作为影响肌萎缩性脊髓侧索硬化症病人疾病发展速率的重要参考。 (2)我们通过应用统计学习模型对病人样本数据进行训练,最终给出了预测肌萎缩性脊髓侧索硬化症病人疾病发展速率的模型,并通过三个指标检验了模型的预后能力。通过特征的有效提取,我们最终能够在大量降低临床成本的基础上,给出一个较好的预后能力模型。