论文部分内容阅读
使用Django框架搭建的一个高频关键词展示平台,对爬虫存入数据库中的数据进行数据预处理分析和高频词的展示。使用Python爬虫技术对网络中的各种数据采集及预处理,使用词频分析算法TF-IDF对数据进行分析,对有效数据使用TF-IDF算法计算权重,并将获取到的大量数据进行筛选分析,通过对"词频"的计算来实现"词频效应"的目的。