icon百度OCR产品icon

百度图像文字识别服务(Baidu OCR)依托业界领先的深度学习技术,提供了多种场景下整图文字检测、定位、识别等功能。

通用类文字识别

✓ 支持10种语言识别,能识别所有常用字和大部分生僻字

✓ 返回文字在图片中的位置信息,方便对版式进行二次处理

卡证类文字识别

✓ 提供对身份证、银行卡、行驶证、驾驶证、营业执照等常用卡片及证照的文字内容进行结构化识别的服务

票据类文字识别

✓ 提供对财税报销、金融保险、银行转汇医疗理赔等场景所涉及的各类票据进行结构化识别的服务

其他类文字识别

✓ 提供对表格、手写文字、网络图片、数字、公式、二维码、VIN码、仪器仪表。印章等内容进行识别的服务

自定义模板识别

✓ 结合多项图像处理技术,针对固定版式的卡证票据自助创建识别模板和分类器实现自动分类和结构化识别

✓ 1张模板图片,5分钟内完成自定义模板

准确率高
基于百度优秀的深度学习算法和海量优质数据,通用、主流卡证识别准确率高达98%以上
服务稳定
提供高可靠性、弹性可伸缩、高并发承载的文字识别服务,服务可用性高达99.99%
场景丰富
支持常用卡证、票据全字段和自定义模板结构化识别,能够满足各类业务场景需求
高效安全
公有云提供各类文字识别的云端Paas服务接口,对接便捷;私有化提供一体机和软件部署包两种方案,保障数据安全
icon百度OCR-通用类文字识别icon

通用类文字识别
通用普通模型:对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种识别,同时支持中、英、日、韩四语种的类型检测

通用高精模型:在通用文字识别的基础上,提供更高精度的识别服务,并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字

图片文字清晰,小幅度倾斜、无明显背光识别率高达90%

应用场景
拍照/图片/翻译识别
可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入
内容审核与监管
对图像中文字内容的提取,结合文本审核技术识别违规内容提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景
视频内容分析
对视频中的字幕、标题、弹幕等文字内容的检测和识别,并根据文字位置判断文字类型,可应用于视频分类和标签提取视频内容审核、营销分析等场景
纸质文档电子化
对各类纸质文档的识别,并返回文字在图片中的位置信息以以便于进行比对、结构化等处理,可文档快速录入、存档和检系的需求,有效降低企业人力成本,提高信息录入效率
合作案例

 

icon百度OCR-卡证类文字识别icon

卡证类文字识别
个人证照:身份证识别、银行卡识别、行驶证识别、驾驶证识别、护照识别、户口本识别、出生证明识别、港澳通行证识别、台湾通行证识别、名片识别等

企业证照:营业执照识别、社会统一信用代码证识别、法人登记证识别、经营许可证识别、完税证明识别

等资产证照:车牌识别、机动车检验合格证识别、不动产证识别、开户证明识别等

应用场景
远程身份认证
结合OCR和人脸识别技术,实现对用户身份证件信息的自动识别和录入,同时通过人脸核身解决方案进行人脸识别和活体检测,完成用户身份验证,有效降低用户输入成本,控制业务风险
金融服务
结合多种卡证识别技术,实现对银行卡、个人信息及企业信息的自动识别和录入,应用于金融场景中的支付绑卡、银行开户、贷款、征信评估等服务
出境旅游/留学
结合多种卡证识别技术,实现对护照、港澳通行证、台湾通行证等境外常用卡证信息的自动识别和录入,应用于境外旅游产品预定、个人信息登记等场景
合作案例

 

icon百度OCR-票据类文字识别icon

票据类文字识别
财务票据:增值税发票识别、定额发票识别、机打发票识别、火车票识别、出租车票识别、行程单识别、购车发票识别等
银行票据:银行汇票识别、银行回单识别、银行支票识别等

保险单据:保单识别等

医疗票据:医疗发票识别、医疗费用清单识别、医疗结算清单识别、病历首页识别、出院小结识别等

支持行业票据定制化训练

应用场景
财税报销
基于财税场景提供多种识别模板,实现对各类税务发票、交通票据等的自动识别和录入,应用于企业税务核算及内部报销等场景
金融保险
结合保单识别和自定义模板文字识别技术,实现对各类保险单据中的投保人、受益人等信息的结构化提取,应用于保单审核、保费核发等场景
财税记账
使用银行回单识别技术,对企业对外交易产生的银行回单凭证进行识别和录入,可应用于企业内部做账及税务核算等场
医疗理赔
通过OCR技术实现理赔环节的医疗票据和单据的结构化信息提取,提升理赔业务效率,降低理赔业务风险,减少人力成本,实现业务职能化升级
合作案例

 

icon百度OCR-其他类文字识别icon

通用类文字识别
表格识别:对单据或报表中的表格内容进行结构化识别
手写文字识别:对图片中的手写中文、手写数字进行检测和识别

网络图片识别:针对艺术字体或背最复杂的文字进行网络图片专项优化识别

数字识别:对图片中的数字进行识别

公式识别:对印刷公式进行识别

二维码识别:识别二维码并提取信息

仪器仪表识别:识别仪器仪表读数

印章检测:对合同文件或常用票据的印章进行检测并返回位置

应用场景
内容审核
使用网络图片文字识别技术,实现对艺术字体或背景复杂的文字内容进行识别,应用于社交、电商、短视频、直播等场景
智能阅卷
使用手写文字识别技术,对学生日常作业及考试试卷中的手写内容进行自动识别,实现学生作业、考卷的线上批阅及教学数据的自动分析,促进教学管理的数字化和智能化
物品信息管理
使用二维码识别技术,对各类物品的二维码或条形码信息进行解析识别,获取相应信息,可应用于商品、药品出入库管理及货物运输管理等场景
合法性检测
使用印章检测技术,可检测合同文件与常用票据中有无印章用于快速确认合同及票据的合法性,并可定位印章位置进行印章图案抠取,有效提高验证效率
合作案例

 

icon百度OCR-自定义模板识别icon

自定义模板识别
自定义模板:只需上传一张模板图片即可自助制作识别模板,建立图片中文字的Key-Value对应关系,实现对相同版式图片的结构化识别

自定义分类器:为需要分类的卡证、票据每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类

自定义字段类型:针对输出值为有限集的字段,用户可上传字段词典限制该字段的输出值,系统会进行输出值的智能纠正匹配,提高识别准确率

应用场景
财务票据识别
对各类发票、收据、银行对账单、承兑汇票等常用财务票据进行模板制作,实现自动分类和结构化识别,并预置多种常用发票模板供直接使用
医疗票据识别
对检验报告单、门诊收费票据、住院收费票据等常用医疗票据进行模板制作,实现自动分类和结构化识别,可应用于医疗数据分析、医药费用报销、医疗票据电子化等场景
特殊卡证电子化
对未提供专门接口,但版式较为统一的各类卡证,如境外身份证(英文)、结婚证、离婚证、房产证、准考证等进行结构化识别
文件电子化
对版式较为固定的文件进行结构化识别,可应用于纸质文件分类归档、信息统计分析、关键内容提取等场景
合作案例

 

icon百度OCR-自定义模板识别示范icon
 
全场景适配:支持任意固定版式卡证、票据的模板制作,实现结构化识别,应用场景广泛
操作简单:仅需提供1张模板图片,即可在5分钟内完成自定义模板制作实现对相同版式图片的结构化识别
自动分类:仅需提供30张相同版式图片,即可自助定制分类器,节省人工分类的成本。同时,我们也预置了大量常用票据训练集,供您直接训练使用
准确率高:针对各类票据的打印字体和样式、套打偏移情况进行专项优化,识别准确率可达95%,卡证、票据分类准确率可达99%以上
icon百度OCR应用场景icon

 

icon百度OCR-金融场景icon

身份验证:利用身份证识别配合活体检测、人脸对比等服务,同时对接权威数据源及验证服务,精确判断用户身份真实性文档电子化:对各类纸质文档及报表的识别,应用于纸质文件分类归档、信息统计分析、关键内容提取等场景

 

icon百度OCR-财税场景icon

支持多种高精度票据识别模型、提供自定义票据识别、混贴报销单票据自动裁切和分类功能,为企业财会场景提供完整的OCR解决方案

 

icon百度OCR-医疗场景icon

通过OCR技术实现理赔环节的医疗票据和单据的结构化信息提取,提升理赔业务效率,降低理赔业务风险,减少人力成本,实现业务职能化升级

 

icon百度OCR-教育场景icon

通过OCR技术实现理赔环节的医疗票据和单据的结构化信息提取,提升理赔业务效率,降低理赔业务风险,减少人力成本,实现业务职能化升级

 

icon百度OCR-交通场景icon

基于图像技术识别驾驶证、行驶证、车牌、VIN码、购车发票、车辆合格证,提高用户输入效率,增强用户体验,应用于司机身份认证、车主信息认证,以及实现对车辆信息的自动识别等场景

 

icon百度OCR-审核场景icon

百度OCR,每天处理几千万的图像文字反作弊请求,进行图像文字、视频文字反作弊,识别图片上面的违规文字

 

icon百度OCR-翻译场景icon

基于文字识别,进行中外文识别,而后通过NLP等技术实现拍照识别文字/翻译功能

基于生僻字的文字识别服务,支持20000大字库的识别服务,帮助生僻字需求用户识别文字

 

 
产品推荐 查看更多>>
    达观数据 文档智能审阅系统

    文档智能审阅系统采用自然语言处理技术、深度学习技术、计算机视觉等技术,打造全新的文档一体化处理系统,能自动抽取文档的关键信息、对比文档之间的差异、审核文档潜在风险、识别提取文档中的表格。现已广泛应用于金融、制造、通信、法律、审计、媒体、银行、政府等多种文字密集型行业,累计服务超100家企业,赋能企业文档流程化、自动化、智能化处理。

    高可用

    高效稳定

    使用便捷

    谛听智能内容审核系统

    谛听智能内容审核系统有效审核各类网络内容,拦截垃圾、违规信息,全方位守护网络内容安全。谛听在订阅的基础上提供服务,免除企业购买或构建本地部署软件的成本,允许用户根据自身需求调节调用次数,最大程度上帮助用户降低审核成本。谛听为用户提供高并发的审核接口,保证系统可用性与流畅度,并为用户提供个性化定制服务与即时响应服务,满足用户不同需求,及时规避内容风险。

    识别精准

    成本低

    更高效

    腾讯云票据识别OCR

    腾讯云票据识别OCR使用深度学习方法,智能检测发票位置、区分类型、提取关键信息,实现支持不同尺寸、版式、角度的多页混贴发票识别。在复杂场景(模糊昏暗、畸变旋转、印章干扰、打印错位等)下鲁棒性强,支持23+细分票种,字段精度可达98%,400+字段通过sdk固定,可快速轻量开发接入。

    混贴多页秒级返回

    支持全票种识别

    支持多方信息校验

    算法技术优势