基于规则的Deep Web查询接口的抽取

来源 :电脑知识与技术:学术交流 | 被引量 : 0次 | 上传用户:xiaoyanger88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以网上书店为例,基于所发现的DeepWeb数据源,针对其查询接口,提出了一种基于领域知识的DeepWeb接口抽取方法,该方法采用正则表达式的规则提取查询接口,包括与控件相邻的文本语义词汇的提取和控件的提取,然而部分查询接口抽取出的文本语义信息比较繁琐,需借助页面中的字体颜色等特征,过滤非需要的信息,达到文中的目标。该方法获得了较好的结果,具有良好的可行性和实用性。
其他文献
医院档案信息化是当前档案专业的热门话题,随着档案规模的扩大,医院档案信息量剧增,传统的手工管理和单纯的实体管理模式己不能适应和满足现代化发展的需要。建立医院档案信
构建可使重组杆状病毒产生多角体的重组转移载体质粒,并将共转染产物喂昆虫幼虫,收集典型病变幼虫血淋巴进行空斑分析,发现子代病毒中约90%为重组病毒.再进行一轮空斑纯化即可获得纯
经典语言是人们学习和效仿的典范,作为中国传统文化的重要组成部分,中医经典蕴涵了诸多人文色彩,它体现出医家知识结构的文人性特点,因而我们在力图将中医学科学化的同时,切
由黑龙江省人民政府主办,黑龙江省社会科学院和俄罗斯科学院西伯利亚分院经济研究所承办的第四届中俄区域合作与发展国际论坛于2006年6月14—15日在哈尔滨市召开。省长张左己,
期刊
美国最杰出的戏剧家尤金&#183;奥尼尔的中期剧作<大神布朗>中的面具手法独具特色,不仅开拓了奥尼尔的艺术领域,为他后来对戏剧的探索和成功铺垫了道路,更丰富了现代戏剧的舞
该文提出一种基于DirectX的图像旋转并实时绘制方式。首先文章概述一个由传统算法完成旋转变换的算法,指出存在的问题和局限性;然后,引入基于DirectX的图像旋转算法,在VS2008中的VC++环境下实验图像的旋转以及实时显示,最后对两种算法进行比较。该算法充分节约CPU资源,将矩阵运算在GPU中实现,极大限度的使用GPU性能,保证图像旋转的运算速率和旋转中的图像质量。
中国人从个人到群体的行事理路受传统政治文化影响是颇深的,如果把这一行事理路放在考察中国人的优势群体(即地方组织、政权机关等)上,则可以发现,该群体行为也充满着中国传
摘要:SAML是由OASIS提出的基于XML规范用于网络应用间用户身份及授权等安全信息描述和交换的一个规范。基于SAML规范,可以在已建立信任关系的不同服务实体间进行认证、授权等信息的传递。该文主要针对以Identity Provider(IdP)发起模式实现Web SSO中对SAML的应用进行一定的研究。  关键词:SAML;Identity Provider;SSO  中图分类号:TP311
伴随着中国改革开放,中国社会阶层的分化开始出现,并逐渐在政策性、渐进性、规模大、阶层分化职业性、刚性弱化而弹性增强、不均衡性和不规范性等方面表现出独有的特点.正确
随着WiFi无线网络技术的发展,越来越多的终端设备支持无线网络接入方法。然而,类似机顶盒,智能电视等终端的人机接口不同于传统PC,特别在无线网络配置的时候,无法采用和普通