论文部分内容阅读
充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义。由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法。首先根据标准地名地址制作匹配语义库,利用规则匹配法精准提取空间信息并实现空间定位;然后将其作为深度学习的样本数据,训练BERT-BiLSTM-CRF模型,实现空间信息的自动提取;再利用前后缀特征词匹配规则作为补充处理,进一步充分提取文本中的空间信息;最后利用地理编码技术实现空间定位。实验表明,本方