论文部分内容阅读
【正】目前已有许多方法和技术来获取计算机可读可写的文档(document)。例如,先用扫描仪扫描,然后用OCR(optical character recognition)识别而产生文档。这是最常见的半自动获取文档的方法之一。更高质量地获取文档是指获取文档的结构和语义。这不是不可能,只是要考