正在阅读:Google已可通过OCR检索扫描PDF文档Google已可通过OCR检索扫描PDF文档

2008-11-04 10:25 出处: 作者:驱动之家 责任编辑:caijunjun

  Google产品经理Evin Levey自豪地宣布,这一切在今天都不同了,因为Google已经可以对任何Adobe PDF格式的扫描文档进行OCR检索,将其转换成文字并纳入索引,在用户搜索的时候就能显示在结果里了,很多重要的文件也可以轻松找到了。

  Google表示,这是搜索技术上一个微小而重大的进步,也是Google致力于让全球信息都能轻松检索、使用的宏伟目标的一部分。

  遗憾的是,Google没有透露这种技术现在都支持哪些语言,但估计是以英语为主,中文可能性不大,毕竟难度太大了。

  点击下边的链接就能看到Google的最新成果了。注意搜索结果已经包含了被检索文档的内容提要,用户既可以直接下载PDF文档并打开原始拷贝,也可以选择“View as HTML”以网页的形式查看Google OCR识别后的结果。

  [repairing aluminum wiring]

  [spin lock performance]

  [Mumps and Severe Neutropenia]

  [Steady success in a volatile world]

Google已可通过OCR检索扫描PDF文档

关注我们

最新资讯离线随时看 聊天吐槽赢奖品