论文部分内容阅读
随着近些年地质工作的进展,我国积累了大量的地质资料,其中包含大量的地质报告文本。由于这些地质报告文本中的内容冗余,文字量巨大,这使得人们快速准确的获取文本标引词的难度大大增加。本文以固体矿产资源地质勘查报告文本为例,分析总结了固体矿产资源地质勘查报告文本的用词特点、句式特点、结构特点。针对这些特点,分析选择适用于地质报告文本的自动标引方法,并初步提出了适合于地质报告文本的自动标引设计方案。