【摘 要】
:
蛋白质相互作用(PPI)网络是研究蛋白质的重要工具,故而对PPI网络的研究有助于人们系统地了解其生物多样性的过程。在科技发展的趋势下,高通量测序技术的成熟,使得PPI网络数据量爆炸式增加,促进了蛋白质相互作用网络的研究。计算机与数学统计的帮助下,蛋白质相互作用网络的数据不再是一团乱麻,利用复杂网络研究蛋白质相互作用关系也成为可能。但是仅仅通过实验测定蛋白质功能进行注释的效率跟不上大数据时代的步伐,
论文部分内容阅读
蛋白质相互作用(PPI)网络是研究蛋白质的重要工具,故而对PPI网络的研究有助于人们系统地了解其生物多样性的过程。在科技发展的趋势下,高通量测序技术的成熟,使得PPI网络数据量爆炸式增加,促进了蛋白质相互作用网络的研究。计算机与数学统计的帮助下,蛋白质相互作用网络的数据不再是一团乱麻,利用复杂网络研究蛋白质相互作用关系也成为可能。但是仅仅通过实验测定蛋白质功能进行注释的效率跟不上大数据时代的步伐,未被标注功能的蛋白质的数目也随着PPI网络数据的增多而日益增大。因此怎样高效的标注蛋白质功能成为生物研究中的重点内容。突破实验预测的效率限制,通过计算方法高效率预测蛋白质功能,将为生物信息学、生物医学、生命机理探究以及更广泛惠及人类生命健康的研究工作打下基础。图小波的应用普遍,拓扑结构灵活,可以提取网络结构图的特征。由于蛋白质相互作用网络具有层次性、重叠性和模块化特性,本文以图小波为研究工具,借助图小波的帮助来提取PPI网络图特征,同时结合距离度量,对蛋白质相互作用网络进行聚类分析,从而寻找蛋白质相互作用网络中的模块化结构,即蛋白质功能社区,进而利用蛋白质功能社区作为辅助模块,帮助预测蛋白质功能社区内部包含的未知功能的蛋白质。即从图小波到蛋白质功能社区,最后再回到针对未注释的蛋白质进行功能预测。这将在通过计算探索蛋白质功能的道路上另辟蹊径。
其他文献
自古以来,投票就是一种体现民主公正的存在形式。随着当代社会的发展和技术的进步,投票采用的形式也从举手计数转变为线上投票计数。然而,当今线上投票系统大多依赖于一个中心化的服务器,普通用户无法得知自己所投出的票是否被后台管理员或利益相关者恶意篡改,即无法验证票据信息的真伪,做不到信息的公正公开。随着区块链技术逐渐进入人们的视野,人们意识到区块链技术具有不可篡改、去中心化、可追溯等优点,数据一旦存入账本
球囊霉素相关土壤蛋白(GRSP)是丛枝菌根真菌产生的一种糖蛋白物质,其性质稳定,不溶于水且耐高温。GRSP在土壤团聚体形成中起重要作用,可以提高土壤团聚体的水稳定性;GRSP作为一种有机质可以为土壤提供大量碳源;同时也能够吸附固定土壤中的重金属元素,对重金属污染土壤生物修复有重要作用。然而,基于目前的提取纯化方法得到的球囊霉素纯度不高,难以用于其结构及性质的分析。本研究采用柠檬酸钠提取法分别从土壤
文字是人类最伟大的发明之一,它承载着丰富的语义信息,在人们的生活中扮演着举足轻重的角色。随着移动互联网技术的快速发展与电子设备的普及,人们进入了一个大数据时代,互联网上充斥着海量的视频数据。视频中的文字信息往往能够更加准确的表达视频的关键内容,文字对于图像处理和视频分析起着至关重要的作用,因此如何准确、高效的从视频数据中提取和分析文字信息成为了近年来人们关注的焦点。自然场景文本相对扫描文档更具有挑
目的:自2009年实施新医改以来,国家大力发展农村地区医疗卫生服务体系,促进乡镇卫生院的建设和能力的提高。在这一背景下,乡镇卫生院的效率评价对改善乡镇卫生院建设和服务具有重要意义。本研究通过对2017年湖北不同功能区域的乡镇卫生院的基本情况和运行效率进行分析,了解湖北省各功能区乡镇卫生院的整体水平和运行效率,分析乡镇卫生院可能存在的问题,为进一步提高不同功能区乡镇卫生院运行效率提供科学依据。方法:
随着科学技术的发展,越来越多的新技术呈现在各领域。同时,产生了大量可供挖掘的文本数据以及待发现的新词汇。在不同的专业领域,专业领域词库的扩充是一项待完善的工作。因而,对特定领域的新词进行准确的挖掘与识别成为了一项待开展的重要研究,因此领域新词发现对自然语言处理提出了更高的要求。本文采用一种无监督的方式,提出了一种DTopWordS-SS(DTopWordS Combining Statistics
随着国内高校信息化科研工作的进行,海量的科研文档得以积累。这些文档中蕴含着丰富的科研信息,目前并未得到有效利用。随着科研文档规模的日益增大,科研工作者若想从中快速准确地获取所需科研信息变得愈发困难。针对上述问题,本文构建了一个科研文档检索与推荐系统,从而帮助科研工作者便利高效地获取科研文档信息。构建该系统的核心工作是将科研文档转化为计算机理解的形式。为此,本文广泛调研了国内外基于机器学习的文本表示
课程论坛是在线开放课程师生交互的重要渠道,相关的测量与评估也成为在线教育数据分析研究的热点。目前用于课程评估的论坛分析常规指标包括发帖总数、参与总人数等。作者通过对某在线学习平台论坛数据的初步分析发现:不但不同学科的课程论坛交互指标的绝对数值存在较大的差异,而且相同学科内不同课程的论坛交互模式也有所不同。因此,在针对课程论坛的教学分析研究工作中,有必要开展相同学科类型课程的归一化相对分析、识别不同
数据挖掘技术在推送企业信息、提升决策效率等方面发挥着重要作用。在实际应用中,经常需要挖掘不同来源的实体之间的关联关系。不同实体对应的数据在存储结构上存在差别,称之为异构数据。多源异构数据网络信息包含数据节点的属性信息、单类网络内部的拓扑结构信息以及异构网络拓扑结构信息。当前提出的预测方法通常只利用了其中部分信息,并且局限于二分网络。为了将三类信息融合进预测过程中,提出了基于图乘运算的多源异构数据链
运载火箭应用广泛,是载人航天、商业发射等航天活动中不可或缺的运载工具。而运载火箭广阔的飞行范围,变化剧烈的气动环境,细长结构导致的弹性振动影响,使得运载火箭控制系统的设计变得更为复杂。同时运载火箭推力下降故障也可能使得控制系统的跟踪性能降低。本文以提升运载火箭姿控系统的跟踪性能为目标,对运载火箭推力下降故障下的容错控制进行了研究。研究内容如下:首先推导了推力下降故障下运载火箭的六自由度非线性数学模
Fad24(factor for adipocyte differentiation24)是一个与脂肪细胞分化密切相关的基因。已有的研究显示,fad24在肌原细胞的分化过程中呈现动态表达,而且该基因缺陷可导致斑马鱼的肌肉发育不良,这预示着fad24可能对成肌分化也具有调节作用,但其作用机制目前尚不明确。本研究利用小鼠C2C12细胞为模型,旨在系统分析fad24对成肌细胞增殖和分化的调节作用。我们利