一种基于Ajax的爬虫模型的设计与实现

来源 :计算机应用与软件 | 被引量 : 6次 | 上传用户：wk4605300051

【摘要】

：

Ajax技术给传统的爬虫带来了巨大的挑战,为了能够提取出在Ajax程序中隐藏的WEB资源,需要解决两大关键问题:JavaScript脚本解析和每一次脚本事件触发后的页面状态信息的保存。提出一种适合Ajax的爬虫模型,在模型中设计了一个嵌入的脚本解析引擎和使用了有向状态图,有效地解决了上述的两个关键问题。实验结果显示该爬虫模型能够有效地提取出Ajax程序中的隐藏资源。

【作者】

：

范轩苗郑宁范渊

【机构】

：

杭州电子科技大学计算机学院,杭州亚龙信息科技有限公司

【出处】

：

计算机应用与软件

【发表日期】

：

2010年01期

【关键词】

：

爬虫脚本解析引擎有向状态图 Crawler Script-parsing engine Directed status graphics

【基金项目】

：

浙江省自然科学基金（Y106176）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于粗糙集的中文文本特征选择方法研究

针对传统的特征选择使用阈值过滤导致有效信息丢失的问题,提出一种粗糙集的文本特征选择方法。该方法以核为起点利用特征属性的重要性和依赖性作为启发式信息进行特征选择,使文本的特征维数得到一定程度的降低。实验表明,此算法不仅易于实现而且能够有效降低特征数目,提高分类效率。

期刊

粗糙集特征选择属性重要性属性依赖性Rough set Feature selection Attribute significance Attribut

天然气甲醇工业国内外现状及发展建议

评述了天然气甲醇工业发展现状,市场情况及新技术开发水平。着重评述了被誉为90年代甲醇技术的LCM最新工艺。从我国特有的能源背景分析指出了大力发展我国天然气甲醇工业的重

期刊

天然气甲醇

非稳态周期操作对合成甲醇的影响

用非稳态周期操作技术研究了合成气合成甲醇。实验结果表明,在反应温度267℃、压力2.0MPa、空速11600h~(-1)时,得到最佳周期操作参数为T=2min、S=0.2、A_1=0、A_2=22.6%(V)、

期刊

甲醇稳态值非稳态周期合成methanolsteady state valuenon-steady state periodic operatio

可信云平台远程证明

可信云计算是一种全新的互联网应用模式,它即将成为人们获取信息和服务的主要方式。但在云平台向用户提供远程证明方面,还存在明显的安全漏洞和不足之处。目前所使用的证明方法暴露了平台的属性信息,使攻击者跟踪这些信息进行有针对性的攻击。使用可信环签名的远程证明方法,可以保证平台的匿名性,保护了平台隐私,提高了平台的安全性。最后,通过IKE协议验证了可信环签名方法,确保了它在云计算平台上的可行性。

期刊

可信云计算远程认证可信环签名Trusted cloud computing Remote attestation Trusted ring signatu

铁基催化剂F—T合成产物分布ASF曲线正偏差探讨

论述了铁基催化剂Ｆ－Ｔ合成产物分布的ＡＳＦ曲线上的“ｂｒｅａｋ”现象，并对这一现象进行了理论解释。

期刊

催化剂F-T合成产物分布铁ASF曲线iron-based catalystF-T syn Thesisproduction distributio

基于MDFT的服装风格决策模型

当今服装款式风格评价都是通过专家主观审视决定的,但服装智能化设计需要有可用于服装风格的决策模型,而已有的决策模型不能很好地体现多款服装风格对比变化,给出基于多择决策场理论MDFT[2](Multialternative Decision Field Theory)的服装款式风格强弱度评价框架,建立了动态的风格决策模型。该模型综合考虑服装部件的属性和决策者心理、外界环境等各种不确定性因素的影响,更接

期刊

多择决策场理论决策模型非理性效应服装风格MDFT Decision-making model Irrational effect Clothing st

络合法制备的F—T催化剂中K助剂的作用

采用多种表征手段研究了柠檬酸络合法制备的Fe-K催化剂的性能,着重考察了助剂K的作用。研究结果表明,该法所制备的催化剂中K起着分散和稳定铁晶粒的作用;此外,Fe与K之间形成

期刊

铁催化剂F-T合成K助剂

基于三维世界的交互式管理信息系统研究

对基于三维世界的交互式管理信息系统进行了研究。采用3DSMAX建模与Virtools后期整合相结合的方法,提供给管理者在虚拟三维全景视图条件下对人员、设备设施及相应的日常工作情况进行精细化管理。同时,在Virtools阵列中根据管理部门人员的不同职别赋予不同的管理权限,通过脚本分组实现权限化的交互功能。提出管理员就是程序员的理念,通过为管理人员提供简单程序式按钮操作,实现对三维管理场景的自定义修改

期刊

三维世界交互性脚本阵列3D world Interaction Script Array

低碳烃转化利用技术进展

介绍了国外低级烃类主要是C_3～C_4烷烃和烯烃化工利用的新进展。对我国石油伴生气资源的综合利用有参考价值。

期刊

低碳烃烷烃烯烃脱氢烷烃异构化lower hydrocarbonschemical utilizationpetroleum associate

基于形式概念分析与分类树法的Web应用测试方法

Web应用软件开发周期短,时间和资源条件有限,要求有高效的测试。应用分类树法从Web应用导航模型自动生成测试用例,并应用形式概念分析对生成的测试用例集进行精简,在满足给定覆盖标准的前提下,得到较小的测试用例集,提高测试效率。

期刊

WEB应用测试分类树法形式概念分析Web application testing Classification-tree method（CTM） Form

一种基于Ajax的爬虫模型的设计与实现

其他学术论文