基于上下文图模型文本表示的文本分类研究

来源 :第四届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:qqq1981115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的基于"词袋"的文本表示方法假定词的权重只和它本身的出现频率有关,而忽略上下文信息.本文提出了一种基于上下文的图模型文本表示方法,使用一种类似PageRank的图模型来建立词和词之间的相互推荐关系,该方法克服了传统文本表示认为词和词之间相互独立,忽略词的上下文环境的缺陷.在复旦中文文本分类和20newsgroup英文文本分类的语料库上的实验表明,我们的方法可以有效地提升文本分类的性能.
其他文献
本报告考察了辽河石化两种环保填充油在轿车轮胎胎面胶中的应用效果。并与国外芳烃油替代品TDAE进行了胶料性能对比。研究结果表明填充辽河石化环保油品的胶料,与填充TDAE油样
由于市场全球化,生产国际化的加速,市场竞争日趋激烈,环境保护要求日益苛刻,降低能耗、物耗的新技术需求日趋迫切,汽车工业和与其密切相关的轮胎工业技术进步,都对合成橡胶的品种、
轴向橡胶垫是货车提速改造用的主要橡胶减振元件之一,主要功能是在转向架发生变形、交叉杆扭动时起缓冲减振作用,产品静态安装处于成对预压缩状态。本文在开发试制的工作基础上
本文以甲基乙烯基硅橡胶为基胶、镀镍石墨为导电填料,研究了导电填料表面处理所用偶联剂的种类及用量对复合材料性能的影响,并借助X光光电子能谱(XPS)对硅烷偶联剂处理镀镍石
本文着重介绍了溶剂型木质素的制备、结构特点以及近几年来在橡胶改性领域的研究进展.溶剂型木质素(organosolv lignin)与传统木质素盐类相比具有反应活性基团含量高、容易提
本文介绍国内外橡胶助剂生产现状、市场需求,重点分析了国内橡胶助剂供求现状,并提出了提高我国橡胶助剂国际市场竞争力的方法与措施.
产品属性抽取是产品意见挖掘的重要任务之一,直接影响着产品意见挖掘的性能.本文提出了一种基于语言依存分析和语料库统计相结合的未登录(OOV)产品属性挖掘算法.该算法基于一
维吾尔语是黏着语,具有比较复杂的形态变化.不管是维吾尔文词典的编纂,还是搜索引擎的开发,或机器翻译系统的研究,都需要对已变形的单词进行形态还原.形态还原或词干提取算法
本文提出基于局部性原理的有意义串提取算法.本文发现有意义串遵循空间局部性原理和时间局部性原理,并用LE值量化字符串的局部性.在此基础上,利用LE值和其他统计量共同提取有
本文提出了一种用层叠条件随机场模型进行汉语框架元素自动标注方法.该方法在低层条件随机场模型中解决了框架元素识别,将识别结果传递到上层短语类型识别的条件随机场模型,