从文本表示看NLP与IR

来源 :中国中文信息学会成立二十七周年学术会议(CIPS2008) | 被引量 : 0次 | 上传用户:super_sxw777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本表示是NLP与IR相融合的关键技术之一,通过在文本表示中引入NLP技术可以减小查询与文档集之间的匹配空间;目前文本表示方法中使用的要么是局部信息,要么是全局信息,这两者的结合有可能使一些深层次的NLP技术引入IR;随着计算机硬件性能的不断提高,新的IR模型将会出现,从文本表示来看,现有的SVM IR,LM IR模型将有可能被以LDA Model为代表的图模型所取代。本文现对NLP与IR;文本表示;IR模型;文本表示下的融合方案做一介绍。
其他文献
本文对块驱动的汉语句法语义研究动机、汉语块描述体系设计不同层次的汉语块标注库、块分析器开发进展、词汇关联性描述以及词汇概念网络开发进行了探讨。
2005年,教育部语言文字信息管理司开始和国内若干高校陆续联合建设语言资源监测中心,其中包括与北京语言文化大学共建的平面媒体语言分中心、与中国传媒大学共建的有声媒体语
会议
本文就继续构建汉语框架语义网(CFN);开展现代汉语句子的语义角色自动标注以及研究在标注语料库基础之上汉语分析模型进行了探讨。
中科院新疆生态与地理研究所荒漠与绿洲生态国家重点实验室科研人员发现,气候变暖加剧了西北高山区冰川的消融,改变了水资源的构成,加剧了干旱区水资源的不确定性,水资源管理亟待
当前,国际人工智能、计算机科学和认知科学研究的一个中心课题就是与智能计算机研制有关的语言学问题。由于自然语言的语义模糊性大、歧义性复杂、最不成体系且最难以处理,因
会议
自我转型,还是寻求合作? 本文就校企合作三要素、高校怎样与企业合作及其企业合作的态度和模式进行了探讨。
互联网信息的爆炸性增长使得每个人都可能访问到海量的网络信息,从互联网宝库中高效率的获取最有用的知识因而成为了当今时代最重要的技能之一。互联网搜索引擎的发展使得普
会议
本文就国际上针对文本倾向性分析的评测情况进行介绍,就任务评测过程和评测结果以及其前景展望进行汇报总结。
本文就面向Web和基于Web的语言分析关键技术;基于Web的语言信息处理重大应用以及中文信息处理在我国信息科技发展中的战略位置进行介绍。
本文对机器翻译技术发展规划进行了探讨,提出了应该注意的一些问题,就其产业化发展的现状及面临的问题做一综述。