基于Xquery的RSS资源查询研究与实现

来源 :商场现代化 | 被引量 : 0次 | 上传用户:nan13519927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] RSS作为xml数据源应用的一种方式,已经得到越来越广泛的应用,但随着RSS信息量的不断增大,RSS应用需要一种有效的数据处理方案拓展其应用面,本文根据xquery规范,使用Qexo模型,实现一种对RSS数据查询的方法。
  [关键词] Xquery XML Qexo
  
  一、前言
  RSS起源于Netscape的MY Netscrpe项目,他是资源描述框架(Resource Description Framework, RDF )的一种应用,当时Netscrpe希望通过使用RSS来描述新闻报导并且允许通过选择想再个人门户上显示得新闻资源来构建他们自己的信息门户,所以得名为RDF站点概要(RDF Site Summery,RSS),通过树状结构变现文档来列出数据,目前很多门户网站都向用户提供了RSS文档。RSS文档作为一种资源共享模式的延伸,给用户提供了信息检索上的便利。
  自1999年RSS诞生起,短短的10年间,RSS经历了飞速地发展,包括最近两年IETF(Internet Engineering Task Force,国际互联网工程任务组)发布的RSS新格式Atom在内,一共有10个版本的RSS格式,其中有很多版本已被废弃,但是还有很多依然在被许多互联网站点使用。
  本文针对RSS提出一种可以实现的资源查询RSS方法。这种方法改变并简化网站对RSS的管理维护,改变信息网站对RSS的管理模式,同时又使得用户可以更自由地选择自己所需要的RSS资源,使RSS可以得到更充分的应用。
  二、基于Xquery的RSS资源查询方法
  本文借鉴Xquery规范,使用Qexo框架实现对RSS数据管理,Xquery是由W3C组织针对对xml数据源查询管理制定的一套查询语言规范,根据Xquery规范,查询xml数据可以和sql语言一样简单。for对应select..from语句,选择RSS数据资源地址,where为条件语句,return返回一个值。以下是xquery制定下对xml数据检索的语句。
  for $i in doc(“url”)/root/element
  where $i/itemname2> 30
  return $i/itemname
  Qexo模型是由java语言编译而成,使用了kawa框架进行转化为符合Xquery规范的xml数据查询模型。Qexo通过拦截所有xql结尾的文件,把xquery查询语句读入KawaPageServlet中,并对其中的查询语句进行编译执行,最后再返回用户所需要的XML资源显示。基于这种对于XML格式数据的操作,Qexo完全可以应用到RSS的数据管理上。把Qexo比作一个RSS过滤器,把RSS资源根据要求过滤为相应的RSS结果集输出。由于Qexo输出的依然还是RSS格式文档,这样,就不需要再设计程序把其转化为原来的格式或HTML格式,一般的IE浏览器可以直接显示输出RSS结果集。
  对于数据的基本操作一般包括查询,排序,归并等,这里使用声明函数编写最常用的数据处理操作:
  函数写入RSS或Atom的pubdate(文件的日期),可以自动对这些信息进行排序。
  对RSS进行查询:
  declare function local:rss-inquiry ($url)
  {
  for $b in doc($url) /rss/channel/item
  where $b/ pubDate > 2008-5-26
  return local:rss-row($b/link/text(), $b/title/text(),$b/ description /text())
  }
  Xquery根据where条件句筛选RSS数据,并返回用户指定元素集。
  Qexo将过滤指令函数嵌入到用来生成输出格式的文档(*.xql)中后。在前台页面调用这些函数时,通过项目调用saxon2.jar包,使用{local:FunctionName(“url”)}调用当页函数进行操作处理出来的,url是从门户网站抓取来的RSS地址。通过这种查詢RSS方式,用户不仅可以从定制更加个性化的RSS资源库,即满足所需即所得,同时,对于提供RSS的网站,也可以简化工作量,提高效率,网站可以把所有的RSS资源合并成一个文档管理,并使用xquery查询修改对其进行更新,而用户则可以使用xquery把抓取过来的RSS资源根据自己的需要进行筛选、归类,实现正真意义上的个性化信息索取。
  三、总结
  在20世纪90年代末,博客软件以及web门户的开发者需要一种标准的数据格式,以便他们能够轻松地联合web上的内容,因此RSS,Atom就此诞生了,RSS从出现到现在10个年头里,将来的web的许多应用都将基于RSS,也正是这个原因,对于RSS的具有数据处理方法也将是一种必要的网页搜索功能得到更广泛的应用,本论文对RSS的数据管理提出了一种基于Qexo模型可行的实现方式,使RSS查询更易管理,为RSS的发展提供了一个可行的方案。
  参考文献:
  [1]Xquery1.0 An XML Query Language[EB/OL]http://wwww.w3c.org/TR/2005/CR-xquery~20051103
  [2]使用 XQuery开发mashup[EB/OL]http://www.mp3sea.net/XML/[2007~03~22]
其他文献
[摘 要] 企业资产减值准备计提所遵循的是谨慎性原则,其初衷是为了使企业会计报表能够客观地反映企业的财务状况和经营成果,但现实却往往不是这样。本文从企业计提资产减值的演变发展入手,对《企业会计准则第8号—资产减值》相关问题进行了探讨。  [关键词] 资产减值 资产减值损失 公允价值 可收回金额    一、企业资产减值的演变  在我国,资产减值的运用经历了四个阶段:  第一阶段,是在《股份有限公司会
期刊
[摘 要] 2008年是全球经济危机是冷战结束后的近二十年所绝无仅有的,就算是1970年代初期石油危机引发的一系列问题也不能与此相提并论,这可能是第二次世界大战结束以来全球经济面临的最大麻烦,甚至是当代经济史、金融史上最大的一次危机。目前这场危机并未结束,人们不得不对更坏的后果有更充分的思想准备。由此必须认真评估这场重大全球经济危机可能引发的政治的、社会的、安全的和其他非纯粹经济的后果。采取相应的
期刊
[摘 要] stata是一款强大的统计软件,本文利用stata10进行审计抽样。首先利用stata10确定属性抽样和变量抽样的样本规模,其次利用stata10创建随机数表和进行等距抽样。  [关键词] 统计软件stata     现代统计软件如Eviews、spss、sas、stata等具有强大的功能,不仅能够进行回归等数据分析,也可以在审计抽样中大显身手。在审计抽样过程中,样本规模的确定和如何抽
期刊
[摘 要] 通货膨胀一直是人们最为关注的焦点问题。2003年~2008年上半年造成通货膨胀的原因比较复杂,主要有货币供给过多、需求拉动、供给推动、结构性因素、制度性因素及预期的因素等多方面因素造成的。当前经济形势发生变化,新一轮的投资热潮是否会历史重演,需要我们高度警惕。  [关键词] 通货膨胀    2003年年~2008年的通货膨胀最早是由房地产市场开始,房地产市场价格上涨必然带动与房地产相关
期刊
[摘 要] 本文以广州酒店从业人员素质提高和培训为切入点,运用现代服务管理理论,分析了广州酒店业员工培训存在的主要问题,探讨了引致这些问题的深层原因,并提出如何通过酒店员工的培训和素质提高来保障广州亚运会服务水平的对策与措施。  [关键词] 广州亚运会 酒店从业人员 素质与培训    2010年亚运会是40多个国家的运动员、教练员、体育官员、新闻记者、赞助商、国内外观光游客等在广州的一次盛大聚会。
期刊
[摘要] 投资高位运行是我国这几年宏观经济的特征之一,相比之下消费却没有大的变化。本文从税收角度,尤其是从给居民带来长期保障的社会保障税入手来分析其在消费与投资中的作用,尤其是对扩大消费的作用,并对我国社会保障税的开征提出了几点建议。  [关键词] 消费率 平均消费倾向 社会保障税    一、高投资,低消费是我国经济运行的突出矛盾之一  在我国这几年出现了投资热、消费冷的局面。从消费率看,我国最终
期刊
[摘 要] 本文概述了跨国并购的涵义,简介了跨国公司和记黄埔和中国国有石油企业的跨国并购情况,并进行比较分析,最后得出中国企业实施跨国并购的对策。  [关键词] 跨国并购 跨国公司 中国企业    当今世界,经济全球化深入发展,跨国并购作为企业对外直接投资的方式之一,逐渐替代绿地投资而成为跨国投资的主导方式。  本文以案例分析和比较分析的方法,选取跨国公司和记黄埔有限公司(下称和黄) 与我国国有石
期刊
[摘 要] 农村信用社(简称农信社)是农村金融工作的主力军,它对推动新农村建设起着积极的作用。但近年来,农村金融市场竞争激烈,运行效率的高低已成为关乎农信社生死存亡的大问题。本文根据农信社多投入、多产出的特点,运用数据包络分析法(DEA)对2007年度陕西省某地区农信社运行效率进行了测算并对非有效的农信社的有效性进行了改进,测算结果表明规模不经济是该地区农信社运行效率低下的普遍原因,提出了提升农信
期刊
[摘 要] 本文主要通过考察我国近期CPI的变动趋势,从单因素及多因素对CPI的影响入手,分别回归出CPI与食品,以及其他各类影响因素的线性模型,并进行相关检验,从而得出CPI持续上涨的驱动因素。  [关键词] 通货膨胀 CPI 回归分析    一、我国CPI的变动趋势(2006年11月~2008年4月)  我国经济在保持持续快速增长的同时,于2005年已初步显现经济过热的迹象,表现在:占居民消费
期刊
[摘 要] 选址在零售企业经营活动中属于投资性决策范畴,其重要性远远高于一般的经营性决策。本文介绍了基于GIS的零售商业网点选址的特点,分析了基于GIS的零售商业网点选址的影响因素,阐述了商圈划分模型和人口一致性模型,并利用缓冲区、人口密度、市场饱和度,分析基于GIS的零售商业网点选址的具体过程。  [关键词] 零售商业网点 GIS 选址    一、概述  零售商业网点是指那些把商品和劳务出售给最
期刊