随着OCR的越来越普及,越来越多的人开始接触到了OCR,所以今天继续和大家分享一下可视化设计开发中的交互设计的一些经验。
部分OCR软件无法识别的情况,是要执行的文本是格式化的。如粗体、斜体、第一行缩进等,将丢失格式或出现混乱。如果您有与格式扫描文本提前确保识别软件支持扫描文本格式。使OCR软件主要集中注意力查找自己正确的字符,也可以通过关闭样式识别信息系统,不再顾及字体和字体格式。
当扫描半透明的身份证件或者其他文件,晦涩的文字字体的文本通过纸背,遇到该类进行扫描,应找出了很大的障碍的原因。只要在一个扫描原稿的背面附,盖一张黑纸,扫描,增加扫描对比度,可以减少模糊字体对背面的影响,提高OCR识别精度。
一般扫描的文档的文本是黑、白双色文件,但往往扫描模式扫描模式设定灰度时却。特别是在原稿质量管理较差时,使用不同灰度模式通过扫描。并在扫描OCR系统软件处理完后再继续学习识别,这样会得到发展较好的识别正确率。
值得注意的是,OCR识别软件能够确定自己家门口,几个百分点的阈值差异,可能会影响正常识别。 在进行大规模手稿扫描时,得到的图像进行文件的大小企业会比黑白合同文件大很多。必须对手稿进行测试,以找到最佳的阈值百分比。
遇到扫描原稿图文混排,首先明确使用的自动识别软件支持此功能的图形分析。如果社会支持自己的话,OCR软件会自动计算出文本的内容、位置和先后发展顺序。在进行分析这类扫描模式识别时,文本部分可根据被识别的正常顺序表示。
如果要扫描OCR技术印刷产品质量稍微差一些的文章,而且在字体的笔画上也会出现粘连现象,比如说通过报纸,扫描的结果将不会使用黑白分明,会出现需要大量的黑点,这两项可是汉字进行识别的大忌,将严重社会影响汉字可以OCR识别的正确率。 为了获得更好的识别结果,我们必须仔细调整音调,反复扫描,以获得更理想的结果。另外,作为报纸薄,大多数纸张不高,导致扫描仪盖板未完全抑制报纸(间隙),这么好的扫描识别一般的报纸,杂志没有效果的影响。OCR解决管理办法是在报纸上压一至两本16K的杂志,效果研究还是一个不错的。
最后,我们得出结论,OCR的识别基础是基于多方面的,如果你能清楚地了解懂得这些知识,会对你的工作帮助许多。
版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2024-03-27 10:16:57
2024-03-27 09:52:36
2022-11-23 15:55:24
2022-11-21 11:15:04
2022-11-21 13:59:21
甄选10000+数字化产品 为您免费使用
申请试用
评论列表