论文部分内容阅读
针对手工抽取招聘网页技能术语不能胜任大数据量信息分析要求的问题,本文针对招聘网页的特点,提出一种从大量招聘网页文本中自动抽取技能术语的方法。该方法引入模糊匹配的思想,首先将拼写错误的候选技能术语标准化,然后引入外部数据特征衡量候选技能术语,以抽取招聘网页技能术语。实验表明本文提出的方法能够从海量招聘网页中自动、快速、准确地抽取技能术语。