浅谈光学字符识别(OCR)的发展简史

来源: 云巴巴 2022-11-21 15:38:16

 

    当你在面对大量的PDF文档时,想要把他们转成文字,又不甘屈服于转文本所需的费用,而且,如果你的打字速度还很慢的话,就快来了解一下什么是OCR吧。

    OCR的全称是光学字符识别,一般是指光学字符识别。是指电子设备,例如扫描仪或数码相机,检查纸上打印的字符。OCR通过进行检测暗、亮的模式可以确定其形状,然后用字符识别研究方法将形状翻译成计算机语言文字的过程;即,针对印刷体字符,OCR采用传统光学的方式将纸质文档中的文字转换发展成为中国黑白点阵的图像相关文件,并通过分析识别系统软件将图像中的文字转换成文本格式,供文字处理这些软件企业进一步提高编辑加工的技术。

    OCR最重要的课题,是如何进行除错或利用计算机辅助信息技术提高企业识别方法正确率。ICR,即Intelligent Character Recognition,这个名词也因此而发展产生。一个好或坏的表现OCR系统的主要指标有:废品率,友好的错误率,识别速度快,用户界面,产品的稳定性,易用性和可行性。

    OCR的发展简史

    或许OCR这个词对于你来说,是一个新兴词汇。但其实,OCR的概念是在1929年由德国社会科学家Tausheck最先发展提出来的,后来由于美国通过科学家Handel也提出了可以利用信息技术对文字内容进行分析识别的想法。1966年就有公司发表了第一篇关于汉字识别的文章,采用了OCR的模板匹配法识别了1000个印刷体汉字。

    早在20世纪60年代和70年代,世界上就开始有OCR研究,在研究的早期,大多数文本识别方法,识别的字数只有09。日本也有,例如文本框,1960年左右开始研究的基本理论OCR识别,最初的数字对象,我们开始有一些简单的产品,如印刷文字的邮政编码识别系统,直到1965年和1970年之间,拉链在邮件代码标识,信分,帮助邮局运营的区域;邮政编码迄今已被世界各国的地址写法主张。日本的学者开始研究汉字识别在20世纪70年代初,并做了大量的工作。

    在70年代中国在OCR技术方面的研究工作才开始。对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年,我国的汉字识别的研究进入一个实质性的阶段,相继推出了中文OCR产品,现为中国最领先汉字OCR技术。

    下篇文章,小编会介绍一下关于OCR的软件结构。

    版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

一文详解OCR识别技术的成熟应用与未来发展趋势

一文详解OCR识别技术的成熟应用与未来发展趋势

OCR识别技术是一种通过图像处理和计算机视觉来识别印刷或手写文字的技术。

2023-06-12 16:52:43

人工智能让计算机视觉感知客观世界

人工智能让计算机视觉感知客观世界

计算机视觉被称为人工智能的“眼睛”,其主要工作任务之一就是可以通过对采集的图片或图像数据进行分析处理。是感知客观现实世界的核心企业技术,以获得相应场景的信息。

2022-11-21 15:58:50

眼神科技虹膜模块,让虹膜识别技术应用更广泛

眼神科技虹膜模块,让虹膜识别技术应用更广泛

眼神科技虹膜识别模块内嵌有眼神科技自主知识产权虹膜识别算法,可以独立完成全部的虹膜识别工作,功能集虹膜采集、处理、存储以及虹膜比对于一体。虹膜模块系列产品预留的有标准开发接口,便于二次开发,多种模块体积适用于不同硬件集成,能够提供丰富的设计空间。

2022-11-24 10:05:38

人脸识别领域又一次革新——腾讯云人脸核身

人脸识别领域又一次革新——腾讯云人脸核身

腾讯云人脸进行识别技术服务在多个国家国际社会公开教学竞赛中刷新世界纪录,人脸数据比对在2017年的 LFW 测评中准确度高达99.80%;人脸信息搜索在 MegaFace 竞赛百万企业规模中首选识别率达83.29%,排名中国第一,识别系统准确率业界领先。

2022-11-23 15:55:53

多模态面部识别一体机的技术特点及应用场景

多模态面部识别一体机的技术特点及应用场景

Eyecool多模态面部识别一体机不同于业内单一的人脸识别产品,而是融合了人脸识别、虹膜识别及其他面部深度特征,具有高安全性、高识别率、可扩展性、实用性等特性,适用于多种安防出入门禁管理,可以广泛应用于办公楼宇、闸机通道、银行金融等场景。

2022-11-24 10:27:01

三分钟教你怎样选择智能电话机器人,电销效率提升200%!

三分钟教你怎样选择智能电话机器人,电销效率提升200%!

AI智能电话机器人是一种以语音自动识别(ASR)、文字转语音(TTS)、 NLU 等技术为基础的智能客服机器人。今天云小巴就给大家推荐几款智能电话机器人产品,让您的工作效率提升200%!

2024-03-27 09:50:18

严选云产品

声网Agora语音互动解决方案 声网Agora语音互动解决方案,全球音频互动一致性体验,优秀的弱网对抗能力,为用户在各种网络环境下提供流畅的互动体验。兼容 iOS、Android、Windows、macOS、Web、小程序等 30 大开发平台,保证全平台一致性体验,适配20000+移动终端。
达观数据银行RPA机器人解决方案 达观智能银行机器人解决方案,基于对银行业务的深刻洞察,创新集成流程机器人、计算机视觉、自然语言处理、知识图谱等自动化领域前沿技术,全面赋能银行信贷审批、国际业务、风险管控、客户画像、智能推荐、运营管理等业务领域,提升风险管理水平和流程运营效率,优化用户体验,助力银行业“数智”化全面升级。
Newline智能会议硬件解决方案 Newline智能会议硬件解决方案,搭载天籁inside拾音解决方案,全新升级8通道线性麦克风阵列,支持12米超远距离拾音,AI降噪、回声消除,可一次性解决键盘、触屏、空调、风扇等超300种日常噪声,犹如面对面般自如交流。
吕睿云客中通小助手 吕睿云客中通小助手,会弹出登录框,通过中天宝盒扫码即可,提示登录成功,就可以给机器人发起查件需求。商家群无法处理的订单会转发至失败群, 并告知订单来源对应商家群。机器人通过关键字识别业务需求,网点可自定义添加业务关键字。
天翼云云服务备份 天翼云云服务备份,针对软硬件故障、人为误删除等场景,为避免关键业务数据丢失,可为云主机、云硬盘创建备份,利用数据进行恢复,最大限度保障用户数据的安全性和正确性,确保业务安全。
奇妙元AI数字人直播平台 奇妙元AI数字人直播平台拥有丰富的真人克隆数字人,含不同职业/不同国家的数字人,更利于直播场景打造,以及1000+发音人资源,让数字人更逼真、更有情感。同时支持TTS驱动和真人语音驱动,双重驱动模式。

甄选10000+数字化产品 为您免费使用

申请试用