【摘 要】
:
监测文本中的药物不良反应是保证患者用药安全的重要途径,也是实施药物警戒的重要手段。传统的监测方法,如自发报告系统存在低效性等弊端。而使用自然语言处理的方法,需要医
论文部分内容阅读
监测文本中的药物不良反应是保证患者用药安全的重要途径,也是实施药物警戒的重要手段。传统的监测方法,如自发报告系统存在低效性等弊端。而使用自然语言处理的方法,需要医药领域专家花费大量的时间和精力构造规则。为了解决上述问题,人们开始使用机器学习的方法抽取文本中的药物不良反应。其中如何提高机器学习算法的分类性能是一个值得研究的课题。本文的主要研究内容包括:(1)特征选择。采用词典匹配、N-gram、主题模型三种方法,基于语料库中的文本构造特征集。采用卡方检验和wrapper方法进行特征选择。(2)基于单一分类器抽取文本中的药物不良反应。选择文本分类任务常用的朴素贝叶斯、逻辑斯谛回归、支持向量机、决策树和随机森林机模型。通过十折交叉验证对分类器进行参数调优。并根据F1值比较五种分类器之间的性能。(3)基于集成分类器抽取文本中的药物不良反应。基于Bagging,采用相对多数投票、加权投票、阈值移动和加权平均策略分别集成上述五种分类器。设置多组实验,对比不同集成策略对集成分类器性能的影响。实验结果表明:与之前在同一文本上最好的研究结果相比,基于构造的特征集使得逻辑斯谛回归分类器F1(80.33%)提高了 3.33%。而基于加权平均策略的集成分类器F1(82.59%)提高了 5.59%。
其他文献
2016年5月,紧随国家税务体制改革的要求,公立医院全面进入营业税改征增值税(以下简称"营改增")的时代。尽管公立医院符合医疗机构免征增值税的要求,但在非医疗服务收入方面必
<正>"这堂课很有意义,听完后一些成长中的烦恼、困惑打消了。"3月18日在贵州省大方县卫计局联合星宿乡开展了主题为"听花开的声音"——青春期性/生殖健康知识进校园活动后,一
《海峡两岸经济合作框架协议》(Economic Co-operation Framework Agreement,以下简称ECFA)于2010年6月29日在重庆签署,履毕相关程序后,于2010年9月12日生效。ECFA可谓一项政
论述了一种用于显像管灯丝二次绕线机的视觉监控系统,它使半自动二 次绕线机成为全自动二次绕线机;阐述了系统的基本工作原理、硬件接口的 工作原理与组成以及软件流程与设计。
<正>森林是"地球之肺",人类的摇篮。森林与人类的发展进步、自然界的生态平衡息息相关。安徽是全国南方集体林区重点省份,林业在全省国民经济和社会发展大局中占有重要地位。
区域内校企合作是京津冀协同发展的重要内容和推动力量,对推动京津冀区域经济和社会发展具有重要意义。京津冀区域内校企合作存在高校参与力度不够、企业合作意识不强、合作
随着教育的发展,韩语的教学也在不断变革中,社会对韩语人才也提出了新的要求。在这种背景下,韩语教学需要创新型教学模式来提高教学效果和学生的韩语综合应用能力及信息素养。慕
Blended Learning(混合式学习)的提出为高校教学改革提供了新的思路和方法,如何将Blended Learning的教学理念较好地融入高校日常教学,设计和实施适合混合式学习的教学策略和
目的:建立芝芪康艾颗粒中的灵芝多糖含量测定方法,优选灵芝多糖的最佳提取工艺。方法:采用正交试验法优选灵芝多糖的最佳提取工艺,以蒽酮-硫酸法测定灵芝多糖的含量。结果:葡
采用静电纺丝技术制备了PVA/[Y(NO3)3+Er(NO3)3]复合纳米纤维,将其在适当的温度下进行热处理,得到Y2O3∶Er3+上转换纳米纤维。XRD分析表明,PVA/[Y(NO3)3+Er(NO3)3]复合纳米纤维为无定型,