1. 什么是OCR?
文字识别也叫 OCR(ptical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
简而言之,就是将图片上的字符信息转换为可编辑的文字内容。数据管理系统提供的「文字识别」字段支持通用文字、身份证、增值税发票、营业执照、驾驶证、行驶证、银行卡以及火车票的识别,只需简单配置,即可实现强大的文字转换处理。
1.1 OCR可以用于哪些应用场景?
- 银行身份认证场景中,只需提交身份证信息,OCR 就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;
- 在企业资质审核场景中,通过上传营业执照,OCR 将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。
1.2 预期效果
从下图可以看出,整个发票识别表单从设计到配置不到 10 秒即可完成,无需开发,无需寻找适配接口对接,更不需要专业的技术人员去维护。
2. 操作步骤
1)首先,在表单中添加「文字识别」字段:
2)添加好字段后选择需要识别的内容进行配置,简道云支持以下内容的 OCR 识别:通用文字/身份证/增值税发票/营业执照/驾驶证/行驶证/银行卡/火车票。
3)确认需要识别的内容后,根据内容设置识别规则。
3. 多端使用
除了管理员设计、配置简单,成员使用也十分便捷。只需上传需要识别的图片,即可由系统自动填写,更支持 PC 端、移动端、Pad 端等多端同步使用。无论是办公室管理人员还是一线操作工人,都可以通过 OCR 快速完成数据录入工作。下面以增值税发票为例演示演示 PC 端与移动端文字识别过程:
- PC 端:
- 移动端:
4. 文字识别日志
管理员可以在「企业管理>> 版本信息」中查询文字识别日志。
在识别日志中可以查看操作人、识别时间、消耗次数以及是否成功等基本信息。识别日志仅保留最近六个月的识别信息。
5. 注意事项
1)OCR 识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)
2)OCR 识别非 100% 精准,目前市面上的接口均无法保证 100% 识别,上传的内容越清晰越容易被识别。目前我们调用的是百度 OCR 识别接口,具体技术限制还可以参考百度官方文件。
本文教程所用工具,可以点击了解更多查看