论文部分内容阅读
建立了一种基于不相交主成分分析(Disjoint PCA)和遗传算法(GA)的特征变量选择方法,并用于从基因表达谱(Gene expression profiles)数据中识别差异表达的基因.在该方法中,用不相交主成分分析评估基因组在区分两类不同样品时的区分能力;用GA寻找区分能力最强的基因组;所识别基因的偶然相关性用统计方法评估.由于该方法考虑了基因间的协同作用更接近于基因的生物过程,从而使所识别的基因具有更好的差异表达能力.将该方法应用于肝细胞癌(HCC)样品的基因芯片数据分析,结果表明,所识别的基因