【摘 要】
:
因为使用生化实验确定蛋白功能需要耗费大量的时间和资源,所以利用计算技术自动标注蛋白功能意义重大。基于文本进行蛋白质功能预测的方法可以充分利用蛋白序列以外的数据。
【基金项目】
:
国家自然科学基金(61572139)
论文部分内容阅读
因为使用生化实验确定蛋白功能需要耗费大量的时间和资源,所以利用计算技术自动标注蛋白功能意义重大。基于文本进行蛋白质功能预测的方法可以充分利用蛋白序列以外的数据。为了探究文本分类中不同的文本表示对蛋白质功能预测任务的影响,通过实验分析了一系列主流的文本表示方法,包括传统的基于词袋模型的稀疏表示(TFIDF)和含有深度语义信息的稠密表示(W2V,GloVe,D2V),并做了两方面拓展:(1)对基于词向量的文本表示考虑使用IDF加权平均(WW2V,WGloVe);(2)稀疏表示与稠密表示的拼接结合(WW2V-T
其他文献
6月26日,由烟台睿綦机电设备有限公司开设,烟台地区第一家三星中央空调专属店隆重开业.三星中央空调新品推介会也在睿綦机电的大力支持下顺利展开,三星中央空调在烟台市场开
近日,以“聚焦经营·聚焦产品”为主题的奥克斯中央空调内销2016年中经营分析会议在南京拉开序幕。奥克斯中央空调总部高层领导及各个营销中心的经理们齐聚南京,为2016年上
全市两年一次的创建文明单位经验交流会胜利召开了,这是市委、市政府召开的一次具有全局意义的重要会议,对此,我们表示热烈的祝贺。党的十四届五中全会和八届全国人大四次会
现有的计算流体力学方法在计算非定常流场时往往需要耗费相当多的时间。为了缩短计算时间,提出一种新的分区计算方法。该方法基于速度—涡形式的N-S方程,将整个流场计算域分
用日本无刺蔷薇作砧木,通过独干嫁接、2~3枝捆绑嫁接和嫁接—扦插—移栽3种处理,砧木自然生长嫁接做对照,嫁接月季品种绯扇,分别进行嫁接成活率、粗生长量及干性的调查及对比
构树是一种优良的盐碱地园林绿化树种,概述了构树的生物学特性以及在东营地区园林绿化应用中具有的多方面优点。
以三门峡黄土丘陵沟壑区为研究对象,进行植被恢复与重建的试验。5年研究结果表明,试验区的森林资源数量和质量得到显著提升,植被恢复效果显著。
以分析河南太行山猕猴国家级自然保护区济源段的区位优势及自然资源优势为基础,综合论证自然保护区核心区外围实验区发展森林旅游的可行性和目前所存在的问题,针对问题,制订进一
根据2006年2月新颁布的《企业会计准则——所得税》和《企业会计准则——合并财务报表》的规定,企业集团在编制合并会计报表时,应当将集团内部成员企业之间的内部债权债务相互
造林时机的选择是造林成活的关键因素,根据树种、苗木类型、立地条件、天气条件等选择不同造林时机,可以确保造林成活率和有效降低成本,禹州市林场在造林时机选择方面的经验值得