论文部分内容阅读
大数据时代,人们面对的问题不再是缺少数据,而是被数据淹没了,即所谓“人们淹没于数据,却饥饿于知识”[1].面对这样的状况,仅靠传统的检索工具已经远远不能满足人们的需要.本文研究了标准文献内容挖掘的关键技术:OCR、正则提取、反向索引,以及标准文献碎片挖掘与检索的系统实现的业务流程、技术框架以及实现效果.