基于临床试验数据的SAS正则表达式应用

来源 :2016年中国生物统计学术年会 | 被引量 : 0次 | 上传用户:yangtianlin888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Statistics Analysis System(SAS)统计分析系统软件被广泛应用于处理临床数据.在处理大批量数据时,人工查找、替换数据时耗时耗力且更易出错.通过SAS Perl Regular Expression正则表达式模块可以更好的识别非格式化的数据,提高工作效率.正则表达式是用于匹配和处理不同文本的一种表达形式,其本身是一种字符串而并非一种完备的可运行的语言或程序.正则表达式被内置于大部分的编程语言或程序当中,它的通用性和可塑性可以使它定义一系列复杂的模式.非定量的临床试验数据例如诊断原因,药品名称等由于来自于不同中心或出自于不同的医师,通常不具有相同的格式,给数据处理造成诸多不便.SAS软件在9.0以上版本中推出了全新的Perl Regular Expression(PRX)功能,通过简单高效的语法和字符串的运用去解决一系列复杂文本的问题.常用到的PRX功能有:Prxparse、Prxmatch、Prxchange、Prxsubstr等语句.
其他文献
在中国,烟草带来沉重的疾病负担,而占全国总人口约1/6的流动人口的吸烟问题却迄今未能引起足够的重视.本研究利用WHO的5A模型通过准试验研究开发制定适合中国流动工人控烟干
了解瑞丽市农村傣族男、女性老年人失能情况,并测算其健康期望寿命.采用整群抽样,对瑞丽市2个乡镇农村187名60岁以上傣族常住老年人口用Barthel指数评定量表测量失能情况,在
宫颈癌发病率逐年攀升,给家庭和社会带来一定程度的医疗经济负担.了解宫颈癌患者的住院费用及其影响因素,并通过递归系统模型分析各因素的直接效应和间接效应,为控制医疗经济
良好设计的前瞻随机对照试验可以提供最高水平的临床科学依据,在医疗界,特别是心脏病学领域,越来越多的药物、器械和临床操作流程被随机对照临床试验确证其有效性和安全性.但
针对需要隔离控制的传染病,如SARS,提出一种新的SEIQCR(Susceptible-Exposed-Infective-Quarantined-Confirmed-Recovered)流行病动力学模型.基于经典的SEIR模型,将潜伏者(E)
全国卫生服务调查每五年进行一次,该项调查主要对全国卫生改革与发展和大众健康情况进行宏观的评价,但当利用这样的数据进行专项研究分析时,可能会遗漏一些重要的影响因素,导
在中国经济飞速发展的今天,中小型企业已经成为经济增长的重要推动力.而其中绝大多数是流动工人.我们的前期调查显示,流动工人的个人防护用品有效使用率仅为50%左右,而职业病
遗传印记效应是一种由于等位基因分别来自父亲与母亲而产生的疾病表达程度不同的表观遗传现象.研究表明,多种复杂疾病与基因印记效应有关.当某种疾病基因印记效应确实存在时,
心脑血管病己成为重大公共卫生问题,其中,脑卒中是严重残疾的首因,死因据世界第三.因其发病、致残和致死率居高不下且防治效果欠佳,脑卒中仍是各国(特别是发展中国家)所面临
治疗质量评价是利用可测量的指标反映医疗技术是否合理地用于患者的治疗,发现治疗过程中存在的问题,促进治疗质量的改善.在医生水平上进行治疗质量评价,可以增加医护人员对治