基于Web挖掘的商业信息抽取研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户：tanshuyao

【摘要】

：

Web商业信息普遍存在互联网HTML文件中,使用传统手工方法来收集这些信息存在很大的局限性,针对Web上存在的大量商业信息,基于Web挖掘技术,提出了使用正则表达式来收集大规模W

【作者】

：

廖开际易聪

【机构】

：

华南理工大学工商管理学院

【出处】

：

情报杂志

【发表日期】

：

2010年5期

【关键词】

：

Web商业信息抽取正则表达式 WEB挖掘

【基金项目】

：

国家自然科学基金“基于服务管理的移动知识管理模型研究”（编号：70871043）, 广东省自然科学基金“移动知识管理中的上下文感知信息处理研究”（编号：7300831）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web商业信息普遍存在互联网HTML文件中,使用传统手工方法来收集这些信息存在很大的局限性,针对Web上存在的大量商业信息,基于Web挖掘技术,提出了使用正则表达式来收集大规模Web商业信息。实现方式是首先获取网页源文件,接着使用设计好的正则表达式对源文件进行编译,从而抽取其中的Web商业信息。实验表明,这种方法抽取的准确率达到93%以上。

其他文献

重症颅脑外伤患者早期机械通气的临床观察

目的观察早期机械通气对重症颅脑外伤患者的预后的影响.方法重症颅脑损伤65例,其中34例入院后予早期机械通气治疗(早期通气组),31例手术时行机械通气治疗(后期通气组).所有

期刊

颅脑损伤机械通气

南京医科大学附属脑科医院神经外科介绍

南京脑科医院创建于1947年，系国民政府第一所国立专科医院，现为三级甲等专科医院。神经外科创建于上世纪70年代初期，现设立床位94张，各级医师20名，其中副主任医师、副教授以上医师

期刊

南京医科大学附属脑科医院神经外科副主任医师南京脑科医院专科医院三级甲等副教授

高校机构知识库系统设计与实现

高校机构知识库系统对现有的机构知识库软件进行了功能扩展。对高校机构知识库系统设计的总体目标、功能、结构及工作流程进行了论述，并介绍了系统部分功能的实现。

期刊