腾讯云文字识别产品OCR_卡证文字识别_票据单据识别-云巴巴 -云巴巴

腾讯云文字识别产品OCR

文字识别（Optical Character Recognition，OCR）基于腾讯优图实验室的深度学习技术，将图片上的文字内容，智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别，也支持运单等手写体识别，支持提供定制化服务，可以有效地代替人工录入信息。

立即咨询

OCR行业背景客户痛点：标准模型难以覆盖大量非标准化需求 icon

市面上除了规范的版式识别，还有大量非标图片需要识别。使用全文识别内容按浏览次序堆砌，与业务无关联，数据可用性差。

智能结构化：适应任意版式，提高数据可用性 icon

智能结构化基于业界领先的深度学习技术和图像检测技术，对于没有制作对应模板的票据卡证，模型自动关联键值寻找文本结果，有效提升文本数据的可用性，提高客户录入效率。

智能结构化：适应任意版式，提高数据可用性 icon

自定义结构化：根据客户传参，智能调整结构化文本内容 icon

智能结构化可由客户自定义建立键值，自定义结构化数据结构。模型底层识别算法精度高，针对各类版式综合识别准确率超过90%，识别对于1300+种常见版式，通过自定义设置后综合准确率可达98%。

智能结构化：一个产品满足附加需求，增加客户粘性 icon

智能结构化：低成本、低门槛、短周期的方式快速接入 icon

为客户的非标准产品需求形成轻量级OCR解决方案。平台整合资源最大程度的优化，避免重复发明轮子，提高效率，降低成本。

产品特性

准确率高

腾讯云文字识别 OCR 可自动从图片中定位并识别字段，印刷体高精度的平均准确率可达95%以上，手写体识别的平均准确率高达85%以上，鲁棒性强。

稳定可靠

腾讯云的身份证识别、名片识别、营业执照识别服务已成功应用于微众银行、QQ、广点通等腾讯内部核心业务，接受过海量用户和复杂场景的考验，各项反馈良好。

适用性高

依托腾讯优图自研的 OCR 技术，涵盖了整个证件检测识别框架的所有核心算法，支持横向、竖向拍摄，适应透视畸变、光照不均、部分遮挡的情况，具备非常高的复杂环境可用性。

简单易用

腾讯云文字识别 OCR 除了可直接调用的全面的 API 接口，还提供了丰富多样的 SDK 供开发者使用，服务使用简单便捷，兼容性强。

多样化配置

腾讯云的智能结构化OCR除各类标准化的卡证识别外，也提供定制化的 OCR 识别，如各类单据的个性化识别，满足多样化的场景应用需要。

应用广泛

腾讯云文字识别 OCR 提供手写体和印刷体的识别，支持多卡证多语言的识别，应用覆盖各个行业。

算法优势：海量数据预训练，精度高、泛化性强 icon

多模态融合，泛化性强
5亿+样本积累预学习，⽀持5000+票单证照识别，以视觉、语义、布局多模态融合更智能。

多场景预训练，准确度高
底5亿+样本积累预学习，层融合高精度识别模型，结合中英文语义分割、语义理解模型，底层识别准确率达99%。

稳定安全，按量付费
腾讯云7×24小时运维，平台稳定性高，平台与接口稳定性高，安全可靠。

无需训练，极速接入
仅需简单传参配置，即刻查看定制个性化结构效果。

算法优势-内置增强算法

内置噪声生成、随机框合并、框切分、相近字替换、随机尺度变换、旋转及透视变化等，解决误连、图像尺度变化、噪声、角度透视问题等。

算法优势-优图算法沉淀

腾讯优图通过自研智能结构化方案，以97.67%的Hmean排名刷新国际权威比赛ICDAR OCR信息提取纪录榜单纪录。

应用场景

用户身份认证

身份证识别可广泛应用在银行、保险、证券行业等需要验证用户身份的场景中，帮助减少用户的信息输入，提升效率，提高用户体验。在视频直播或网约车场景中，可以通过身份证识别进行主播或乘客的身份认证，降低业务风险。相关云产品推荐：身份证识别、银行卡识别、行驶证/驾驶证识别。

票据单据识别

用于企业员工发票报销，通过 OCR 技术提取各种纸质发票、凭证上的发票号码、金额、发票代码等关键信息，支持数据录入和自动核对，减少人工校验成本。在快递行业中，存在大量的手写或机打运单，对于这类信息的录入存档消耗了大量人力物力，通过 OCR 识别技术，可有效降低人力投入成本，优化业务流程，提升快递行业效率。

出版物图像转文本

通用文字识别技术可以将大量纸质文档转换成可编辑的文本，为文字排版、信息检索提供极大的便利。通用文字识别技术可以将出版物的图像转成可编辑的文本，在出版物的归类、检索等方面，极大地降低人力投入成本。推荐产品：文档还原、通用印刷体文字识别（高精度版）、英文识别。

文本审核与管理

在电商行业中，通用文字识别技术可以智能识别广告图中的文字内容，过滤广告中的不良信息，为企业降低业务风险。在各类视频场景中，通用文字识别技术可以快速识别视频中的字幕信息，有效地区分文字内容是否合规。推荐产品：通用印刷体文字识别、通用印刷体文字识别（高精度版）。

客户案例：集成智能结构化识别核酸记录，助力复工复产 icon

腾讯问卷、腾讯技术公益、微搭集成腾讯云智能结构化，推出疫情健康申报服务，一个接口智能识别不同地区的用户核酸截图，抽取信息对检测结果日期校验，助力复工复产。

传统模式下，保理机构自身发展也面临数字化水平、展业效率等问题的约束。腾讯云保理业务通过集成智能结构化，节省评估流程与定制费用，降低了保理机构的风控难度，简化了操作流程，快速搭建保理业务系统。

与市面友商方案对比

友商采用传统的模板类字段检测，采用将目标字段转化为图像目标检测的方式，检测后再进行文字识别或利用正则规则进行简单纠错。正则规则需为不同场景编写匹配规则，难以覆盖所有场景情况。智能结构化可结合语义与海量数据特征预学习，线上自动优化识别效果。

其他常见问题解答

• Q：智能结构化与通用文字识别的差异？

• A：通用文字识别方式为按顺序从上到下、从左到右全识别出来。智能结构化在文字识别的基础上，对信息二次处理，将关键值抽取后作关联，可用性更高。

• Q：智能结构化与其他垂类引擎能力的差异？是否可以购买这个能力识别标准类型的数据？

• A：垂直模型针对训练，精度可以达到99.9%，并且对应提供其他功能服务如PS告警等，标准类型图片建议您选择对应垂类接口。

• Q：什么是键值对？设置键字段应注意有哪些事项？

• A：键值对 (key: value) 是是一种简单的对应关系，键后面对应着相应的值。传Key适用于相同版式或相同Key情况下的不同图片，可将其值传入以对后续传入的图片做Value匹配和矫正。

• Q：智能结构化传入图片应注意哪些事项？

• A：默认接口请求频率限制默认 5次/秒。传Key适用于相同版式或相同Key情况下的不同图片，识别输入图片的前置条件经Base64编码后不超过 7M，图片下载时间不超过 3 秒。

• Q：支持的语言与文字样式有哪些？

• A：智能结构化是针对不同识别区内容类型进行专项优化的识别模型，本阶段产品支持识别标准印刷体，语系支持汉字和拉丁语系，语义理解效果支持中文和英语。未来规划支持多语种的结构化识别，您可以联系产品团队了解具体规划。

• Q：智能结构化对表格的识别效果如何？

• A：智能结构化本阶段支持一维表格的抽取识别，未来规划支持多维表格的抽取识别，您可以联系产品团队了解具体规划。

• Q：智能结构化识别表格，与表格OCR垂直接口的区别？

• A：智能结构化主要功能为文本的抽取和关联，表格识别接口适用于多维表格的识别、或表格的还原需求场景。

• Q：智能结构化对日期字段是否有特殊处理？

• A：产品对于日期的格式做了规范处理，默认格式为“XXX年XX月XX日”“XX时XX秒”，以提高混合类型图片下的数据可用性。

• Q：智能结构化是否可以识别特殊符号？

• A：产品支持特殊符号的识别，所见即所得，例如金额符号、运算符号等，以满足业务逻辑判断。如不需要特殊符号，您可以将识别结果做相关正则处理。

• Q：智能结构化是否支持手写体识别？

• A：现阶段产品暂时不保证手写体的识别准确率，未来规划支持手写体的识别，您可以联系产品团队了解具体规划。

• Q：需要在现效果基础上，如何提升准确率或结构化效果？

• A：若需要进一步效果优化，您可以联系商务团队和产品团队协助，我们为您提供产品迭代规划与适用方案。

产品推荐

迪普科技FW1000下一代防火墙

防火墙作为最核心的安全设备，访问控制是其基本功能，但基于五元组进行访问控制，很难做到精确地限制用户访问并识别相关应用。DPtech FW1000下一代应用防火墙，可实现基于用户的应用访问控制，且具备丰富的NAT功能，解决公网地址不足的问题。DPtech FW1000下一代应用防火墙可灵活部署于互联网出口、数据中心、分支机构安全互联等复杂场景，满足各类用户需求。

免费试用

查看详情