【摘 要】
:
常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于
【机 构】
:
深港产学研基地,北京大学信息科学技术学院,哈尔滨工业大学软件学院,哈尔滨工业大学深圳研究生院计算机科学与技术学院
【基金项目】
:
原创项目研发与非遗产业化资助项目(YC2015057).
论文部分内容阅读
常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于词边界字向量的中文命名实体识别系统。该方法利用神经元网络从大量未标注数据中,自动抽取出蕴含其中的特征信息,生成字特征向量。同时考虑到汉字不是中文语义的最基本单位,单纯的字向量会由于一字多义造成语义的混淆,因此根据同一个字在词中处于不同位置大多含义不同的特点,将单个字在词语中所处的位置信息加入到字特征向量中,形成词边界字向量,将其用于深度神经网络模
其他文献
背景与目的:临床及实验研究结果表明,残留白血病细胞与急性早幼粒细胞白血病(acute promyelocytic leukemia,APL)患者的治疗及复发显著相关。实时定量逆转录PCR(real-time quantita
社会利益是经济法的本位利益,社会利益是一个综合性概念.当代中国的社会利益可以分为三个层次(社会安全、机会公平、社会进步)与五个具体方面(生存、发展、平等、国家安全、
如果以中国教育学百年的发展为主线,主体性教育思想的发展也有近百年的历史。对中国主体性教育思想的思考应从历史和现实不同维度同时入手。对历史的求索,能发掘出主体性教育
背景与目的:研究表明,哺乳动物雷帕霉素靶蛋白(mammalian target of rapamycin,mTOR)在恶性肿瘤发生发展中起重要作用,本研究观察特异性mTOR抑制剂雷帕霉素联合紫杉醇对卵巢癌细
随着现代社会经济的发展,我们逐渐进入了以消费为主导的阶段,而市场对服装品牌的传播实际上在不经意间已经创造了一种服装消费文化和生活方式。在中国有足够的市场资源以及需