从管理者到教师,从家长到学生,每个工作在各个环节都要与文档打交道,而光学字符识别(OCR)技术可有效把图片上,或者是PDF格式的文字内容智能识别成为可编辑的文本,正在新的时代为更多行业创造着独特全新的价值。
OCR文本识别
OCR文本识别在传统技术中采用模板匹配的方式方法进行分类,但是,对于文本行,它只能从文本的最后行通过识别每个字符的内容来确定。因此我们可以对文字行进行一个字符切分,以得到提高单个文字。这样,超切-动态规划是最常见的分割方法。
由于OCR技术在多个单个字符识别结果可能由于切割位置,例如,“诸如”出现的单词是不切割期间的时间被分割为“M _嘴”,所以需要进行过分割候选字符,它在足以粉碎,接着动态编程合并分割成芯片,以获得最佳的组合,该方法需要人工设计损失函数。
还有另一种OCR方法是通过使用滑动窗口对每一个可能的字符数据进行分析匹配,如果滑动窗尺寸过大会制度造成企业信息系统丢失,这种方法的准确率依赖于滑动窗口的滑动窗尺寸,而太小则会使计算力需求得到大幅增加。
通过OCR技术识别每个单个字符来实现识别文本的上述传统方法中,该过程导致的上下文信息的损失的单个字符具有高的识别精度,这是由一个条目确定难以保证精度。以身份证识别为例,即使单字符进行识别方法正确率可以高达99%,OCR识别18位的身份号的场景下,其条目平均正确率只能到0.9918=83%,如果一个切分也存在1%的损失(即正确率99%),条目以及正确率则只有(0.99*0.99)18=70%。
因此,引入上下文信息已成为提高条目准确性的关键。从学习的深度的观点出发,被引入的序列信息这样的上下文中,RNN LSTM等依赖于神经网络的定时关系是最好的选择。
所以当初为了研究汉字 OCR 识别,开发者实验了 N 种算法——要么是识别效果不好,要么是识别太慢,要么是样本库太大——最后选择的是一种接近深度学习的多层神经网络算法,终于实现了相对满意的汉字识别效果。
以上就是光学字符识别(OCR)技术的相关内容,光学字符识别(OCR)技术的核心是文本识别,通过文本识别可以进行有效分类。也欢迎你了解更多关于光学字符识别(OCR)技术的知识。
版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-21 13:48:44
2022-11-23 16:30:20
2022-11-22 09:41:24
2022-11-22 15:35:37
2024-09-14 17:41:00
甄选10000+数字化产品 为您免费使用
申请试用
评论列表