分布式网络爬虫技术的研究与实现

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:lt5185
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的快速发展,很多与Web关联密切的服务也在带动下逐渐增多,在工作和生活中得到了越来越多的应用,同时,人们也对此提出了更高的要求。这就不可避免地对进行Web信息采集的网络爬虫技术提出了越来越高的标准。尽管从目前的发展形式,国内外很多公司都对此提出了较为成熟的解决方法,但是这种搜索引擎带给大众的是相对固定的搜索服务,并不能够充分满足所有人的要求。在这种情况下,单机的网络爬虫并不能够解决这种问题,中型规模的网络爬虫也就根据其快速、高效率的信息采集方式以及可定制性,满足了用户在此方面的需求。从此角度出
其他文献
以韦努蒂异化翻译策略为指导,依托《京华烟云》英文版,从语言、宗教、社会、物质以及习俗类文化负载词5方面进行研究和分析,阐明了在翻译过程中所运用的直译、增译、替代加解
受体编辑是B细胞免疫耐受发展的主要机制。大量研究表明,受体编辑异常与恶性肿瘤、自身免疫性疾病和免疫缺陷病的发病机制有关,其中磷脂酶Cγ-2(PLCγ2)是前BCR和BCR受体转导
研究了对转双转子电机,并利用该特种电机构建一种新的电动汽车驱动系统。分析了对转双转子电机的工作原理。以永磁同步对转双转子电机为例,设计了永磁同步对转双转子电机以及
文章采用决策有用性的观点,定义了盈余质量,认为盈余质量研究的核心问题是决定盈余质量属性背后的因素,从会计报告的供给和需求可以解释现实中盈余质量的多样性。股权结构是