切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
会议论文
基于N元文法和封闭词的词类标记方法的数学模型
基于N元文法和封闭词的词类标记方法的数学模型
来源 :第三届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:bangliju
【摘 要】
:
本文提出一种基于N元文法和封闭词的词类标记的数学模型,该模型以二元Markov模型为基础,以封闭词词性的预确定有效地降低了应用Markov模型进行词类标记时算法的复杂度。实验证
【作 者】
:
唐云廷
吴岩
【机 构】
:
浙江大学宁波理工学院,宁波,315000
【出 处】
:
第三届全国信息检索与内容安全学术会议
【发表日期】
:
2007年期
【关键词】
:
文法
词类标记
标记方法
数学模型
准确度
复杂度
证明
应用
算法
实验
基础
词性
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于N元文法和封闭词的词类标记的数学模型,该模型以二元Markov模型为基础,以封闭词词性的预确定有效地降低了应用Markov模型进行词类标记时算法的复杂度。实验证明,该方法的词类标记的准确度达到了较高的水平。
其他文献
重复串特征提取算法在不良信息检测中的应用
根据同一类文档的主题相关性,利用文档实例集中频繁出现的一组重复子串作为该类文档的特征描述,设计了基于重复串的特征提取算法。该算法避免了分词处理。实验表明,能够降低特征
会议
特征维数
提取算法
信息检测
文档
特征描述
分词处理
相关性
主题
中频
效率
实验
设计
基于浅层语义树kernel的阅读理解答案句抽取
本文提出一种利用浅层语义信息的英文阅读理解答案句抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树kemel的方法计算问题和每个候选句之间的语义结构
会议
浅层
语义树
阅读理解
方法
语义角色标注
结构相似度
语义信息
树状结构
计算问题
准确率
匹配数
语料
英文
选择
融合
抽取
测试
基于E-Chunk问句实例库问答系统的研究
研究了一种基于E-Chunk的问句分析方法,设计了应用该方法时的各种语义知识及其表示,用Xml文档来管理领域知识,在这种知识库上设计了一种答案抽取的方法。在此基础上,开发了领域问
会议
实例库
问答系统
分析方法
设计
原型系统
语义知识
领域知识
答案抽取
准确率
知识库
召回率
应用
文档
实验
开发
价值
基础
管理
面向中文新闻领域的移动摘要系统*
面向移动终端的自动摘要技术,对摘要本身提出了更严格的字数要求。本文设计了一个面向中文新闻领域的移动摘要系统,提取新闻网页中的最大重复串作为文档的关键词集合,利用编辑距
会议
中文新闻
移动终端
文档
层次型
自动摘要
新闻网页
结构
方法验证
编辑距离
子标题
完整性
可读性
关键词
覆盖率
显示
系统
提取
实验
设计
评测
基于动态内容的文摘方法研究
随着互联网的发展,信息的更新越来越快,从而导致内容的动态演化性越来越明显。为了从不断更新的动态内容中生成文摘,本文提出了一种具有时序偏向的多文档文摘方法——动态文摘。
会议
动态内容
多文档文摘
相关研究
解决方案
建模方法
演化性
互联网
性能
信息
时序
基础
面向课程教学的中文问答系统研究
大规模开放式问答系统过于偏重于知识的广度,在面向课程教学的问答系统则对问题回答的针对性和准确性要求相关较高。在教与学的过程中,面向课程教学的具有智能化的中文问答系统
会议
课程教学
中文
问答系统
智能化
自然语言
问题回答
认知模式
句法分析
教学过程
分词算法
准确性
开放式
决策树
教与学
知识
学习
学生
信息
偏重
基础
一种改进K-means聚类算法在多文档文摘中的应用
本文采用一种改进的K-means聚类算法自适应地发现多文档集合中的潜在子主题。该方法从整个文档集合的统计信息中获取必要的参数信息来确定初始类别数和初始聚类中心。它能克
会议
聚类算法
多文档文摘
初始聚类中心
多文档集合
类别数
系统效率
统计信息
算法效率
方法
参数信息
自适应
子主题
证明
应用
实验
经验
获取
基于多重索引模型的大规模词典近似匹配算法
编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法。本文提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划
会议
GatherCore:一种面向采集系统的工具集
Web采集程序是web应用的重要组成部分。GatherCore包含了采集程序所需的核心工具,如:采集工具、链接提取工具等。该工具集运行稳定,有较高的速度,能够支撑很多应用,如我们已经和正
会议
采集系统
提取工具
采集程序
运行稳定
应用
新闻采集
工具集
组成
支撑
链接
开发
希望对本刊的工作提意见
亲爱的读者《读书》杂志创刊以来,已经一年多了。为了改进工作,提高质量,迫切希望您对我们的工作提出意见。我们特别想知道您对下面这几个问题有些什么看法: Dear reader
期刊
亲爱的
提高质量
《读书》
通讯地址
纸书
下面
校对
邮政编码
其他学术论文