基于XSLT的PDF论文元数据的优化抽取

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:HuSiYou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。
其他文献
在伦敦奥运会上,被寄予厚望的中国女子网球队经历了我国网球奥运史上最为惨痛的失败,引起了社会的普遍关注。在面对失败的同时,若不能对此次失败进行彻底的总结,必将对我国网球运
人参皂甙Rg1能调节机体运动中及运动后的能量代谢。然而其机制还没有阐明。本文以大鼠为实验对象,主要从机体运动后的糖原合成与运动中葡萄糖摄取方面来探讨人参皂甙Rg1的作用
以北京体育大学成人教育学院为例对高等体育成人教育管理信息化进行了较为深入的研究。论述了高等体育成人教育管理信息化实施的必要性,分析了实施的可能性;认为数字化校园建设
借助文化学的思考方法,以文化冲突为视角,在解析武术文化发展内在动力的基础上,从“土洋”文化冲突、传统文化与现代文化的割裂、文化理想与消费的冲突、文化理论研究与实践