论文部分内容阅读
人类基因组有超过30亿个碱基对,其中大约包含有20 000个蛋白质编码基因,仅约占人类基因组的1.5%,非蛋白质编码基因占人类基因组的98.5%,ENCODE项目研究发现至少80%的人类基因组被转录成无编码蛋白质能力或编码能力极低的非编码RNA(non-coding RNA,ncRNA)。ncRNA根据长度大小可分为:小于200个核苷酸的短链非编码RNA(short ncRNA),主要包括microRNA、rRNA、siRNA等;大于200个核苷酸的长链非编码RNA(long non-coding RNA