数字化社区

浅谈光学字符识别（OCR）的发展简史

浅谈光学字符识别（OCR）的发展简史

2022-11-21

当你在面对大量的PDF文档时，想要把他们转成文字，又不甘屈服于转文本所需的费用，而且，如果你的打字速度还很慢的话，就快来了解一下什么是OCR吧。

OCR的全称是光学字符识别，一般是指光学字符识别。是指电子设备，例如扫描仪或数码相机，检查纸上打印的字符。OCR通过进行检测暗、亮的模式可以确定其形状，然后用字符识别研究方法将形状翻译成计算机语言文字的过程；即，针对印刷体字符，OCR采用传统光学的方式将纸质文档中的文字转换发展成为中国黑白点阵的图像相关文件，并通过分析识别系统软件将图像中的文字转换成文本格式，供文字处理这些软件企业进一步提高编辑加工的技术。

OCR最重要的课题，是如何进行除错或利用计算机辅助信息技术提高企业识别方法正确率。ICR，即Intelligent Character Recognition，这个名词也因此而发展产生。一个好或坏的表现OCR系统的主要指标有：废品率，友好的错误率，识别速度快，用户界面，产品的稳定性，易用性和可行性。

OCR的发展简史

或许OCR这个词对于你来说，是一个新兴词汇。但其实，OCR的概念是在1929年由德国社会科学家Tausheck最先发展提出来的，后来由于美国通过科学家Handel也提出了可以利用信息技术对文字内容进行分析识别的想法。1966年就有公司发表了第一篇关于汉字识别的文章，采用了OCR的模板匹配法识别了1000个印刷体汉字。

早在20世纪60年代和70年代，世界上就开始有OCR研究，在研究的早期，大多数文本识别方法，识别的字数只有0到9。日本也有，例如文本框，1960年左右开始研究的基本理论OCR识别，最初的数字对象，我们开始有一些简单的产品，如印刷文字的邮政编码识别系统，直到1965年和1970年之间，拉链在邮件代码标识，信分，帮助邮局运营的区域;邮政编码迄今已被世界各国的地址写法主张。日本的学者开始研究汉字识别在20世纪70年代初，并做了大量的工作。

在70年代中国在OCR技术方面的研究工作才开始。对数字、英文字母及符号的识别进行研究，70年代末开始进行汉字识别的研究，到1986年，我国的汉字识别的研究进入一个实质性的阶段，相继推出了中文OCR产品，现为中国最领先汉字OCR技术。

下篇文章，小编会介绍一下关于OCR的软件结构。

版权声明：本文为Yun88网的原创文章，转载请附上原文出处链接及本声明。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里！

热门数字化产品

item.productInfo.name

句子互动SCRM系统句子互动SCRM系统，把企业微信账号变成机器人，实现更效率和高频次的触达。基于预设规则和对象特征，让消息推送更智能更精准。帮助企业打通内外部系统的数据系统，实现更多灵活、更个性化的营销和服务能力开发。同时支持私有部署、iframe嵌入等多种系统接入方式。

item.productInfo.name

尘锋SCRM系统尘锋SCRM系统传统客户关系管理的基础上，引入社交平台的好友关系，为各行业企业主提供更全面的客户画像洞察，更准确的业务决策分析，更有效的客户运营手段。帮助企业在获客、转化、运营3大环节显著提效，助推企业业绩的持续增长。

item.productInfo.name

橙色云CRDE智橙协同设计研发平台橙色云CRDE智橙协同设计研发平台是SaaS云原生平台，整合云CAD、项目管理、BOM管理等多功能，支持多终端、跨地域协同工作。它以云PLM与云CAD一体化为核心，提供一站式产品创新解决方案，推动企业数字化转型，实现高效、低成本研发设计。

item.productInfo.name

飞扬UTMS物流管理云系统飞扬UTMS物流管理云系统，SaaS UTMS云系统，飞速部署，在线升级；电脑端手机端功能及数据全部打通，小程序比app更轻更方便，随时随地移动办公，数据统计随时看；系统内置丰富营销工具，按需选用借助微信生态，有效拉客获客，先人一步掌握成交机会。

item.productInfo.name

法大大电子合同SaaS平台法大大电子合同法律效力等同于纸质合同，保障用户权益。人脸生物科技识别、银行卡要素等多重技术手段实名认证，确保颁发电子签名为本人专有。向企业和个人提供全流程的电子合同服务，完善的产品与服务体系。

为你推荐

2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖，载誉而归

1月16日，2025腾讯产业合作伙伴大会在三亚召开。云巴巴，荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17

传统AI代码工具效率低下？TAPD MCP Server让开发效率与质量双倍飙升

腾讯TAPD作为国内领先的敏捷研发管理平台，可以说是最早拥抱MCP的研发管理工具之一，凭借其全生命周期的研发管理能力，成为AI代码助手的“最强外挂”，其创新功能直击开发痛点。

2025-04-25

如何提升政企客户服务效率？协同管理+规模触达成政企服务质量选型新标准

基于预设规则和对象特征，让消息推送更智能更精准，帮助企业打通内外部系统的数据系统，实现更多灵活、更个性化的营销和服务能力开发。

2025-04-25

如何利用数据分析做好活动营销？海纳嗨数让活动策划执行更加高效便捷

海纳嗨数凭借其专业的数据分析能力，为企业提供从数据采集到深度洞察的一站式解决方案，助力活动策划与执行实现质的飞跃。

2025-04-25

复杂网络环境下，如何通过弱网加速与源站高可用技术架构保障业务零中断？

网宿科技全站加速产品以弱网优化与源站灾备技术矩阵，构建全链路加速体系，通过核心技术为多场景提供端到端保障，实现弱网效率跃升、源站切换无感，助企业突破网络桎梏。

2025-04-24

查看更多