【摘 要】
:
Hadoop是开源的一个分布式系统基础架构,借助Hadoop,可以在不了解分布式底层细节的情况下,开发分布式程序。文本索引在生产生活中有着广泛的应用,从搜索引擎的倒排索引到操作
论文部分内容阅读
Hadoop是开源的一个分布式系统基础架构,借助Hadoop,可以在不了解分布式底层细节的情况下,开发分布式程序。文本索引在生产生活中有着广泛的应用,从搜索引擎的倒排索引到操作系统的指令都需要使用文本索引。在hadoop环境中构建文本索引,能够为搜索引擎和文档全文索引提供支持,并且同时兼顾了分布式系统的优点。在Hadoop环境中构建本索引的主要价值有:在分布式平台Hadoop建立倒排索引可以提高建立索引的速度,能够方便的存储大数据量,有着良好的扩展性以便实现在大规模系统中等优点。
其他文献
核酸生物传感器在涉及分子生物学的研究领域具有重要意义,为适应分子生物学及其相关学科的发展需要,其研究正成为90年代生物传感技术研究热点。文章对核酸生物传感器的工作原理、
为优化强流脉冲电子束(HCPEB)改性过程的工艺参数,以获得最佳的脉冲时间和电子束能量密度,利用有限元方法,模拟了对表面涂覆铝膜的CoCrAlY电子束轰击过程的温度场分布,分析了
基于CD8+T记忆细胞的线性和逆线性分化假说分别建立了数学模型,并研究了各种T细胞亚类的动力学.发现在优化剂量抗原入侵的条件下,两个模型均能产生记忆,并可较好地模拟实验结
为了解决具有仲裁的认证码中仲裁不可信的问题,提出了A^3码的概念。在认证系统中,3个参与方(发方、收方和仲裁方)都不可信,这是一个符合现实环境的认证系统,具有广泛的应用前景
在对视频通信中的控制方法进行研究时,人们关注的重点往往是差错控制中的的选择性重传技术,本文主要从基于决策位置的重传方法、基于优先级的重传方法、基于网络状态的重传方
应用多光子激发激光扫描显微镜对5-羟色胺(5-hydroxytryptamine, 5- HT)孵育的大鼠粘膜型肥大细胞进行自发荧光成像,首次观察到了活细胞内5-HT相关的可见荧光,并对其产生机理
在电力企业的营销管理工作中,电力企业的营销人员需要做到以客户为中心进行相应的营销活动,这样才能够保证营销活动的针对性。因此,在本文的研究中,主要针对于以客户服务为中
AIM To determine the pathogenesis and potential single nucleotide polymorphisms(SNPs) as screening sites for colonic polyps,colon cancer and ulcerative colitis,
变位系数的计算是插齿刀设计的重要工作。本文讨论了插齿刀变位系数满足产生齿顶变尖、被切齿轮齿根的过渡曲线干涉、根切和顶切等四个约束条件的选取原则。给出了设计新刀的
用流式细胞计(FCM)测定H2O2损伤后的红细胞(RBC)与IgG的结合能力,并直接检测细胞自发荧光的变化,以研究H2O2对RBC抗原性和脂质过氧化(LPO)荧光产物生成的影响。结果表明RBC抗原性和自发荧光变化与H2O2浓度和作用时间