【摘 要】
:
目的针对医疗数据发布和共享中患者隐私泄露风险以及人工去标识效率低的问题,本文提出了一种基于规则和机器学习结合的算法,以有效去除电子病历中的患者隐私信息。方法根据美
【机 构】
:
上海交通大学附属第六人民医院,上海交通大学生物医学工程学院
论文部分内容阅读
目的针对医疗数据发布和共享中患者隐私泄露风险以及人工去标识效率低的问题,本文提出了一种基于规则和机器学习结合的算法,以有效去除电子病历中的患者隐私信息。方法根据美国健康可携行与责任性法案和中文电子病历的表达习惯,将隐私数据分为数字、日期及命名实体三大类,利用正则表达式识别数字以及日期隐私数据,引入隐马尔科夫模型识别命名实体。最后使用上海市第六人民医院的出院小结作为测试数据,利用留出法测试了隐私数据识别的召回率和精确率。结果该模型总体得到了超过90%的召回率,其中数字和日期类型的隐私数据召回率都超过96%,
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
釉灰的使用和配制,是中国古代制瓷业一项重要的工艺技术。关于炼灰配釉之事,散见于多种古代文献。然而在以往开展的考古调查和发掘中,并未报道发现了关于此的实际的遗迹和遗
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
目的:探讨宫颈液基细胞学检查(TCT)联合高危型人乳头瘤病毒(HPV-DNA)检测进行妇女宫颈癌早期筛查的价值。方法:对我院妇科门诊接受宫颈病变筛选的妇女共1845例,随机分成3组;A组,162例,
为了提高毫米波雷达对前方车辆检测的准确性,本文提出一种基于机器学习的前方车辆检测方法。结果表明,该方法满足智能客车环境感知系统对于实时性和准确性的要求。
“X荒”作为主观高量义构式,可表达“某物缺乏的程度达到高量”。该构式句法上可以作宾语、主语、谓语,主要用于陈述句;语义上,可表达主观高量义且“荒”语义指向X;语用上,可
6月14日,北京市物业管理纠纷人民调解指导委员会成立。此前,北京市宣武区已经率先试行了解决物业纠纷的人民调解模式,并取得了显著的成绩,北京市将向全市推广宣武区的这一做法。
近来,在我们的周边发生了几件事。一件是北京有个房地产项目叫NAGA上院,开发商给每个业主分配了物业管理公司的股权,让每个业主都成为物业管理公司的股东,参与物业管理公司的管理
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield