论文部分内容阅读
随着互联网的飞速发展,Web网站的数量越来越多,Web的用户量成倍增长。用户行为分析成了一个重要的课题。而基于Web日志的信息挖掘具有重要的意义,分析WEB日志是挖掘的首要步骤。本文旨在分析NCSA扩展日志格式(ECLF)的WEB目志文件,利用正则表达式,预先处理摔一些无用的信息,然后将所得的信息入库。为用户行为分析打下数据的基础。