论文部分内容阅读
文本挖掘是指通过特定的技术,在大量的信息数据中找到符合要求的用户所需资料.而中文文本数据需要通过中文信息处理技术,才能够得以实现.所以,如何有效地分词是在中文文本信息处理中一个需要关注的问题.为了确保在众多的信息中快速找到最符合用户需求的信息,对中文文本的分词速度是重中之重.故本文将从现阶段中文分词的算法研究、常见分词方法以及如何实现分词做以说明.