本期内容https://zhuanlan.zhihu.com/p/105804622
图片和PDF是我们日常学习和工作过程中接触较多的文件存储方式,它的确对数据的传输和内容的安全性带来了便利,但是,也为内容使用带来了一定的麻烦–需要重复性的劳动。
每当我们需要PDF或者图片中的文字,用于编辑或者翻译时,这时候就开始让人头疼,暴力复制会引起很多格式的错乱,最终只能无奈的重新输入一遍。重新输入对于篇幅较小的可以考虑,但是对于内容较多的却让人望而却步。
随着这两年OCR(Optical Character Recognition,光学字符识别)技术的成熟,越来越多的人开始考虑利用OCR来解决上述问题。因此,OCR相关的工具如同雨后春笋一样,层出不穷。这里面不乏有非常实用的工具,但是,我更愿意用群魔乱舞来形容当下的OCR工具。
有一些工具曾经以免费出道,风靡一时,然后开始推出收费版,而免费版的就如同废弃品一样,让人惨不忍睹,比如之前风靡一时的天若OCR。
也有一些甚至不如天若OCR的工具,从一开始就变小的不堪入目,识别结果乱七八糟,稳定性非常差。
经过一段时间的试用和对比,我精挑细选出6款OCR工具,其中,包括2款网页端、2款PC端、2款手机端,总有一款适合你。
1/网页端OCR
ocr.space
ocr.space是一款值得大书特书,且真正惊艳到我的OCR工具,甚至可以说,有了ocr.space,后面的5款可以选择性的忽略。
目前大多数OCR工具都会受限于以下几个弊端,
- 仅支持图片识别
- 免费次数有限
- 支持语言较少
而这里要介绍的ocr.space,可以当之无愧的称得上Best Free OCR,它有如下几项让人眼前一亮的优点:
- 支持格式多:支持JPG、PNG、GIF、PDF、URL等作为输入。
- 支持语言多:支持英语、中文、法语、德语等20+种语言。
- 免费:ocr.space的免费是不限次数的免费。
正是因为它的强大,所以,很多其他OCR工具都用它作为API进行二次开发封装成工具,例如,后面要介绍的ShareX。
ocr.space的使用方法非常简单,只需要可以直接上传PDF和图片,也可以粘贴它们的链接,然后选择要识别的语言,其它选项默认,点击Star OCR!即可。
极客OCR
极客OCR同样是一款免费的网页端OCR工具,但是,需要指出的是,它的免费是限制次数的,每天限制上传10张图像,另外,极客OCR相对于ocr.space也有一点不足就是,它只支持图片格式不支持PDF。
但是,既然介绍它,说明它也有自身的优势,
- 支持46种语言
- 支持多种输出格式
极客OCR支持的语言要比ocr.space多一些,如果格式为图像,且ocr.space不支持相应的语言,可以考虑极客OCR。另外,它的使用方式也相对简洁明了,
- 上传图像
- 选择输出格式
- 开始转换
2/PC端
ShareX
ShareX是一款完全免费开源的工具。
严格意义上来讲,ShareX并不是纯粹的OCR工具,反而,称其为截图工具更为合适,我在前面一篇介绍截图工具时曾经提到过ShareX。
但是,我还是希望再次以OCR工具的身份再次介绍这款工具,因为,在OCR功能方面,它同样要明显优于大多数工具。
ShareX有如下几点优势,
- 完全免费
- 功能丰富
ShareX是一款以截图为发起点,可以选择一系列连续动作的复合工具。你可以选择截图后上传、截图后保存、截图后加水印、截图后扫描二维码。
当然,也可以选择截图后文字识别,这样,它就成了一款OCR工具了。
树洞OCR
树洞OCR和ShareX有两点相似之处,
- 支持截图识别
- 完全免费
树洞OCR除了支持截图识别之外,还可以上传图片。除上述两点之外,还有两点非常吸引我,
- 跨平台,支持MacOS
- 支持换行
首先说一下第一点,目前支持Android、iOS、Windows三个平台的OCR工具非常多,但是,支持MacOSSierra的却屈指可数,我觉得这就是我在这里介绍树洞OCR的主要原因之一。
其次,支持换行,当我阅读英文文献时,解决OCR识别问题可以选择上述工具,但是,我想要翻译时还有一个不可忽视的点–换行符,如果直接拷贝OCR识别结果去谷歌、百度翻译,会发现非常混乱,这时候就不得不逐个删除换行符。
因此,对于经常阅读PDF格式英文文献的同学,可以考虑使用树洞OCR。
手机端
洋果扫描王
手机APP是很多公司抢占的热门方向,OCR工具自然不会逃脱善于抓住商机的眼光。
手机端OCR工具相对于网页端、PC端都要多很多,但是,付费软件所占的比例也要高很多。
而洋果扫描王可以称得上是一个另类,它完全免费,不限次数的免费。
另外,洋果扫描王不单纯是一款OCR工具,它更像是一款百宝箱,它支持但不限于以下几项功能,
- 文字识别
- 翻译
- 人脸测试
- 花草识别
- 证件识别
- 车型识别
这里尤其需要着重介绍的就是文字识别和翻译。
我们可以直接以拍照和选择图片的方式识别图片中的文字,然后可以直接进行翻译,另外,翻译方面它支持中文、日语、英语、韩语、法语等语言。
白描
白描是一款商业化更重的一款APP,之所以称其为商业化重是因为,它包括普通版和会员版,普通版每天限制识别5次,我认为这对大多数用户已经足够使用了。
白描商业化更重,为什么还要在这里推荐呢?
因为,更重的商业化,同时带来的就是更加的用户体验,它识别准确率更高、速度更快。此外,还支持拍照翻译文字、文件转录、身份证识别、购物小票识别、截图文字提取、纸质文件电子化等使用功能。
当然,就如同前面所说的那样,我认为白描免费用户每天5次识别已经能够满足大多数用户的使用,因此,我们也可以把它视为一款免费软件。
干货
最近,为了方便大家,我花费了半个月的时间把这几年来收集的各种实用工具整合到一起,其中涉及影音娱乐、效率办公、系统清理、编程开发等上百款强大工具,其中涵盖Windows、Mac、Andriod、Chrome,我把各种软件的安全下载链接整理到一个文档中供大家使用,减少麻烦、避免踩坑,目录如下:
所有干货送给大家,希望能够点赞支持一下!
https://pan.baidu.com/s/1StnTCgCgOful535PMU_ioQ (提取码:0000)