基于文本的生物信息获取

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户：jackydu

【摘要】

：

随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长.因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫.我们的研究主

【作者】

：

王浩畅赵铁军于浩

【机构】

：

哈尔滨工业大学计算机与技术学院,哈尔滨,150001

【出处】

：

全国第八届计算语言学联合学术会议

【发表日期】

：

2005年期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长.因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫.我们的研究主要致力于两方面的内容:一个是命名实体的识别,另一个是实体关系抽取.研究方法主要有:基于特征向量的机器学习方法、基于规则的方法和基于统计的方法,我们在蛋白质名称的识别上取得了较好的结果.

其他文献

简明状态句及其汉英句类和句式转换

无谓语动词句(无动句)的理解和处理历来是汉语自然语言处理的一个难点,基于动词中心论的语言学理论对于无动句的描述和解释是非自足的.HNC理论定义了四组无特征语义块句类(无

会议

简明状态句汉英句类汉语自然语言处理语言学理论特征语义块动词中心论语义结构描述句式转换翻译探讨动词句谓语解释机器规律

基于NN-LSVM的日语依存关系解析

日语依存关系解析是基于日语依存文法,确定句子中各个文节间的依存关系.为提高解析精度,提出一种基于NN-LSVM对大规模训练语料进行修剪的日语依存关系解析方法:使用LSVM和NN

会议

日语依存关系解析训练语料依存文法训练样本精度京都大学解析方法语料库解析器修剪分类测试

智能Web信息检索相关研究

本文介绍了近期在Web信息检索领域所进行的研究工作.首先,在自适应文本信息过滤研究中,采用了基于多次反馈的增量学习机制来构造过滤模型,并在模型自适应学习过程中引入特征

会议

TREC中提高检索鲁棒性的技术研究

本文提出了两种提高检索鲁棒性的方法:(1)词义熵权重计算公式;(2)两级处理策略.在NLPR-IR信息检索系统上,以TRECRobutt任务提供的大规模标准文本库(528155篇文档,250个公开的

会议

面向商务信息抽取的产品命名实体识别研究

市场信息化使得商务信息抽取、市场内容管理日益成为信息科学领域的一个研究热点.产品命名实体识别作为其中非常重要的关键技术之一也逐渐受到人们的关注.本文面向商务信息抽

会议

商务信息抽取产品命名实体识别隐马尔可夫模型市场信息化自由文本原型系统识别方法内容管理科学领域关键技术数码和手机实验汉语电子

模式推理中的"图检索"算法

模式推理,又称为推理,是一个有着重要研究价值的课题.在问答系统的研究中,模式推理作为一种新的研究途径,具有较高的应用价值,也因此受到较高的关注和研究.在问答系统领域,模

会议

基于互联网的汉语术语定义提取研究

本文的术语定义抽取,在分析术语定义的语言学特征,进行硬匹配的基础上,通过将术语定义用词与人民日报用词进行对比,给出了词语和句子的定义隶属度这一概念,并且与向量空间模

会议

基于互联网汉语术语定义语言学特征用词匹配算法空间模型隶属度智能向量提取实验人民基础概念词语抽取

面向文本分类的多类别SVM组合方式的比较

支持向量机是性能良好的二类分类模型,适用于处理文本分类问题.但支持向量机无法直接用于处理多类分类问题.本文考察了四种流行的多类支持向量机方法,包括one-against-rest,p

会议

文本分类支持向量机方法数据集多类分类问题性能差别中文分类中英文比较实验分类模型处理直接用应用考察差距

生物医学文献中的隐含知识发现

当前出版的医学信息呈指数级增长,给在生物医学文献中应用文本挖掘技术进行隐含医学知识发现提供了前所未有的机会.本文对隐含医学知识发现的研究内容、研究成果进行了阐述,

会议

基于HMM的农作物信息抽取

本文以因特网(中国北方农业信息网等网站)上的种子资源作为语料资源,采用聚类的方法,生成训练语料,得到领域的主题集:通过训练主题和主题之间的关系,建立了针对水稻农作物的H

会议

基于文本的生物信息获取

其他学术论文