iconOCR行业背景 客户痛点:标准模型难以覆盖大量非标准化需求icon

市面上除了规范的版式识别,还有大量非标图片需要识别。使用全文识别内容按浏览次序堆砌,与业务无关联,数据可用性差。

icon智能结构化:适应任意版式,提高数据可用性icon

智能结构化基于业界领先的深度学习技术和图像检测技术,对于没有制作对应模板的票据卡证,模型自动关联键值寻找文本结果,有效提升文本数据的可用性,提高客户录入效率。

icon智能结构化:适应任意版式,提高数据可用性icon

智能结构化基于业界领先的深度学习技术和图像检测技术,对于没有制作对应模板的票据卡证,模型自动关联键值寻找文本结果,有效提升文本数据的可用性,提高客户录入效率。

icon自定义结构化:根据客户传参,智能调整结构化文本内容icon

智能结构化可由客户自定义建立键值,自定义结构化数据结构。模型底层识别算法精度高,针对各类版式综合识别准确率超过90%,识别对于1300+种常见版式,通过自定义设置后综合准确率可达98%。

icon智能结构化:一个产品满足附加需求,增加客户粘性icon
icon智能结构化:低成本、低门槛、短周期的方式快速接入icon

为客户的非标准产品需求形成轻量级OCR解决方案。平台整合资源最大程度的优化,避免重复发明轮子,提高效率,降低成本。

icon产品特性icon
准确率高

腾讯云文字识别 OCR 可自动从图片中定位并识别字段,印刷体高精度的平均准确率可达95%以上,手写体识别的平均准确率高达85%以上,鲁棒性强。

稳定可靠

腾讯云的身份证识别、名片识别、营业执照识别服务已成功应用于微众银行、QQ、广点通等腾讯内部核心业务,接受过海量用户和复杂场景的考验,各项反馈良好。

适用性高

依托腾讯优图自研的 OCR 技术,涵盖了整个证件检测识别框架的所有核心算法,支持横向、竖向拍摄,适应透视畸变、光照不均、部分遮挡的情况,具备非常高的复杂环境可用性。

简单易用

腾讯云文字识别 OCR 除了可直接调用的全面的 API 接口,还提供了丰富多样的 SDK 供开发者使用,服务使用简单便捷,兼容性强。

多样化配置

腾讯云的智能结构化OCR除各类标准化的卡证识别外,也提供定制化的 OCR 识别,如各类单据的个性化识别,满足多样化的场景应用需要。

应用广泛

腾讯云文字识别 OCR 提供手写体和印刷体的识别,支持多卡证多语言的识别,应用覆盖各个行业。

icon算法优势:海量数据预训练,精度高、泛化性强icon
多模态融合,泛化性强
5亿+样本积累预学习,⽀持5000+票单证照识别,以视觉、语义、布局多模态融合更智能。
多场景预训练,准确度高
底5亿+样本积累预学习,层融合高精度识别模型,结合中英文语义分割、语义理解模型,底层识别准确率达99%。
稳定安全,按量付费
腾讯云7×24小时运维,平台稳定性高,平台与接口稳定性高,安全可靠。
无需训练,极速接入
仅需简单传参配置,即刻查看定制个性化结构效果。
算法优势-内置增强算法
内置噪声生成、随机框合并、框切分、相近字替换、随机尺度变换、旋转及透视变化等,解决误连、图像尺度变化、噪声、角度透视问题等。
算法优势-优图算法沉淀
腾讯优图通过自研智能结构化方案,以97.67%的Hmean排名刷新国际权威比赛ICDAR OCR信息提取纪录榜单纪录。
icon应用场景icon
用户身份认证
身份证识别可广泛应用在银行、保险、证券行业等需要验证用户身份的场景中,帮助减少用户的信息输入,提升效率,提高用户体验。在视频直播或网约车场景中,可以通过身份证识别进行主播或乘客的身份认证,降低业务风险。相关云产品推荐:身份证识别、银行卡识别、行驶证/驾驶证识别。
票据单据识别
用于企业员工发票报销,通过 OCR 技术提取各种纸质发票、凭证上的发票号码、金额、发票代码等关键信息,支持数据录入和自动核对,减少人工校验成本。在快递行业中,存在大量的手写或机打运单,对于这类信息的录入存档消耗了大量人力物力,通过 OCR 识别技术,可有效降低人力投入成本,优化业务流程,提升快递行业效率。
出版物图像转文本
通用文字识别技术可以将大量纸质文档转换成可编辑的文本,为文字排版、信息检索提供极大的便利。通用文字识别技术可以将出版物的图像转成可编辑的文本,在出版物的归类、检索等方面,极大地降低人力投入成本。推荐产品:文档还原、通用印刷体文字识别(高精度版)、英文识别。
文本审核与管理
在电商行业中,通用文字识别技术可以智能识别广告图中的文字内容,过滤广告中的不良信息,为企业降低业务风险。在各类视频场景中,通用文字识别技术可以快速识别视频中的字幕信息,有效地区分文字内容是否合规。推荐产品:通用印刷体文字识别、通用印刷体文字识别(高精度版)。
icon客户案例:集成智能结构化识别核酸记录,助力复工复产icon
腾讯问卷、腾讯技术公益、微搭集成腾讯云智能结构化,推出疫情健康申报服务,一个接口智能识别不同地区的用户核酸截图,抽取信息对检测结果日期校验,助力复工复产。
传统模式下,保理机构自身发展也面临数字化水平、展业效率等问题的约束。腾讯云保理业务通过集成智能结构化,节省评估流程与定制费用,降低了保理机构的风控难度,简化了操作流程,快速搭建保理业务系统。
icon与市面友商方案对比icon

友商采用传统的模板类字段检测,采用将目标字段转化为图像目标检测的方式,检测后再进行文字识别或利用正则规则进行简单纠错。正则规则需为不同场景编写匹配规则,难以覆盖所有场景情况。智能结构化可结合语义与海量数据特征预学习,线上自动优化识别效果。

icon其他常见问题解答icon
• Q:智能结构化与通用文字识别的差异?
• A:通用文字识别方式为按顺序从上到下、从左到右全识别出来。智能结构化在文字识别的基础上,对信息二次处理,将关键值抽取后作关联,可用性更高。
• Q:智能结构化与其他垂类引擎能力的差异?是否可以购买这个能力识别标准类型的数据?
• A:垂直模型针对训练,精度可以达到99.9%,并且对应提供其他功能服务如PS告警等,标准类型图片建议您选择对应垂类接口。
• Q:什么是键值对?设置键字段应注意有哪些事项?
• A:键值对 (key: value) 是是一种简单的对应关系,键后面对应着相应的值。传Key适用于相同版式或相同Key情况下的不同图片,可将其值传入以对后续传入的图片做Value匹配和矫正。
• Q:智能结构化传入图片应注意哪些事项?
• A:默认接口请求频率限制默认 5次/秒。传Key适用于相同版式或相同Key情况下的不同图片,识别输入图片的前置条件经Base64编码后不超过 7M,图片下载时间不超过 3 秒。
• Q:支持的语言与文字样式有哪些?
• A:智能结构化是针对不同识别区内容类型进行专项优化的识别模型,本阶段产品支持识别标准印刷体,语系支持汉字和拉丁语系,语义理解效果支持中文 和英语。未来规划支持多语种的结构化识别,您可以联系产品团队了解具体规划。
• Q:智能结构化对表格的识别效果如何?
• A:智能结构化本阶段支持一维表格的抽取识别,未来规划支持多维表格的抽取识别,您可以联系产品团队了解具体规划。
• Q:智能结构化识别表格,与表格OCR垂直接口的区别?
• A:智能结构化主要功能为文本的抽取和关联,表格识别接口适用于多维表格的识别、或表格的还原需求场景。
• Q:智能结构化对日期字段是否有特殊处理?
• A:产品对于日期的格式做了规范处理,默认格式为“XXX年XX月XX日”“XX时XX秒”,以提高混合类型图片下的数据可用性。
• Q:智能结构化是否可以识别特殊符号?
• A:产品支持特殊符号的识别,所见即所得,例如金额符号、运算符号等,以满足业务逻辑判断。如不需要特殊符号,您可以将识别结果做相关正则处理。
• Q:智能结构化是否支持手写体识别?
• A:现阶段产品暂时不保证手写体的识别准确率,未来规划支持手写体的识别,您可以联系产品团队了解具体规划。
• Q:需要在现效果基础上,如何提升准确率或结构化效果?
• A:若需要进一步效果优化,您可以联系商务团队和产品团队协助,我们为您提供产品迭代规划与适用方案。
产品推荐 查看更多>>
    誉能票博士微信小程序

    票博士微信小程序是基于业界领先的人工智能深度学习技术开发而成,是一个集拍照采集、自动查验、上传于一体的发票识别工具。将采集获得的发票数据与发票图片结构化存储,从而实现对数据的共享访问,有利于开展基于发票数据的各项业务活动。

    采集发票

    自动排重

    发票查验

    数据提交

    腾讯云媒体处理MPS

    媒体处理(Media Processing Service,MPS)是一种云端音视频处理服务。基于腾讯多年音视频领域的深耕,为您提供极致的编码能力,大幅节约存储及带宽成本、实现全平台播放,同时提供视频截图、音视频增强、内容理解、内容审核等能力,满足您在各种场景下对视频的处理需求。

    极速高清智能编码

    极致的编码内核

    画质增强

    画质修复

    腾讯千帆海风统一门户 TMPL

    千帆海风统一门户(TMast Portal,TMPL)致力于为企业构建以用户为中心、体验融合一致、架构开放敏捷的集统一门户、统一待办、统一流程、应用可插拔为一体的企业级数字化平台。作为企业新一代门户,聚合业务系统的待办、消息、流程、应用,帮助企业提升业务效率、降低管理成本。

    打通应用登录,构建一站式工作台

    汇集系统待办,提高办公体验

    快速搭建流程中心,提高业务效率

    上千生态应用,随意插拔