基于访问日志的网页内容监控挖掘系统

来源 :计算机工程 | 被引量 : 0次 | 上传用户:txzhang50
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
URL是用于完整描述Internet上网页和其他资源地址的一种标识方法,URL访问日志能记录用户的上网痕迹。针对该特点,提出一种基于访问日志的网页内容监控挖掘系统,实现网页内容抓取、监控、分析、报表生成等一系列过程的自动化。系统运行测试结果表明,该系统的准确率较高,能有效解决运营商和互联网监管部门的网络监管问题。 URL is a complete description of the Internet and other resources on the Internet address of a logo, URL access log can record the user’s Internet traces. Aimed at this characteristic, this paper proposes a web content monitoring and mining system based on access logs, which can automate a series of processes such as web content crawling, monitoring, analysis and report generation. The system running test results show that the system has a high accuracy and can effectively solve the network supervision problems of operators and Internet regulators.
其他文献
由中国农业科学院油料作物研究所选育的芝麻新品种“中芝13”,自通过全国品种鉴定以来,已累计推广1100多万亩,净增经济效益6亿多元。该品种具有“三高一广”特性——高耐湿、高
【课程标准】掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。【教学分析】本节课属于教科版《信息技术基础》中"2.3文件的下载"中的一节重要内容,2.3.1文件及
今年以来,山西省祁县公路段坚持以科学发展观为统领,紧紧围绕公路工作的中心任务,认真履行公路法和公路管理条例赋予的职责,加强组织领导,健全相关制度,强化法制宣传,推进执
文章以明代汇编式杂著《醉古堂剑扫》为原本,通过对中国古代文人人生视野的审视与思维方式的考察,对其中涉及的园林审美思想进行了梳理与概括,归纳出书中所包含的绿色生态、空间
随着社会和经济的不断发展,在我国水资源日益紧张的今天,推广应用水利节水灌溉技术具有十分重要的现实意义,本文详细阐述了农田节水灌溉技术的发展趋势,就我国农田水利灌溉工
针对需要处理海量数据的控制系统,为了能够快速获取实时数据,提出了移植FAT文件系统到ARM中,将实时采集的海量数据保存到SD卡的设计方案,该方案以S3C2440 ARM9为嵌入式平台,
我的凤河被露水打湿的青草被花香浸泡的思念多么苦啊
本文总结了泰来县土壤风蚀区风沙土地治理开发的几种模式,探讨不同风沙土地类型的防治措施和治理方法,为防治土地沙化和沙土地治理提供了治理开发模式.
在很多数据交换场景中,应用程序通常需要将XML数据的某些部分映射到关系数据库行集中,就SQL Server如何解决这个问题进行讨论.首先介绍0PENXML的引入背景,结合给出的示例文档
以57家河北省高校学报为研究对象,从类别分布、区域分布、创刊时间、出版周期、传播情况、影响因子和特色建设7个方面进行统计分析,指出高校学报发展的特点和规律.