论文部分内容阅读
伴随着信息技术的飞速发展,航天工程项目面临着航天工程产品的更新换代速度不断加快、尖端技术不断应用、系统复杂程度日益提高、技术风险问题日益严峻等问题,对航天工程项目进行有效的风险管理已成为航天工程管理的重要内容。实施风险管理不仅可以提高航天项目管理水平、降价航天项目成本、提高效益、确保航天工程目标的顺利实现,还有助于航天工程资源以及社会资源的优化配置及经济的稳定发展。 本文对航天工程技术风险文本分类的研究,将文本挖掘的理论知识及方法引入到航天工程风险管理中,构建了基于文本挖掘的航天工程技术风险分类模型。该模型以基于风险评价矩阵的航天工程技术风险文本为研究对象,通过构建航天工程技术风险分词词典和停用词库来对大量的风险管理文本进行处理,接着选用信息增益法对文本特征进行提取并确定文本特征的权重,然后采用支持向量机算法构建文本分类器。最后,选择多种核函数和多种算法进行对比,并采用RapidMiner软件从查准率、查全率和F1值三个指标来验证所提方法的有效性及泛化能力。 本文所构建的航天工程技术风险分类模型,在一定程度上解决了传统风险分类效率低、过分依赖专家经验的问题,对航天工程风险管理具有十分重要的实践意义。实验结果表明,基于支持向量机的分类模型的文本分类效果优于朴素贝叶斯和K近邻算法的分类效果。因此,该方法在处理航天工程技术风险分类问题上是可行的。本文在中文分词处理中未考虑数据缺失及语义对文本分类的影响,这也是进一步研究的方向