论文部分内容阅读
文章提出了一种基于词向量与cRF中文命名实体。核心观点为:命名实体识别任务本质上为序列标注任务。常见的序列标注模型有HMM,MEMM,CRF。HMM模型是对转移概率和表现概率建立模型。MEMM模型为将转移概率与表现概率构建为联合概率,统计为条件概率。MEMM经常为局部最优,原因是MEMM归—在部分。CRF模型计算了整体概率,当归一时,顾及信息在整体的出现,所以避免了MEMM标记偏移的出现。