百度图像文字识别服务(Baidu OCR)依托业界领先的深度学习技术,提供了多种场景下整图文字检测、定位、识别等功能。
通用类文字识别
✓ 通用普通模型:对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种识别,同时支持中、英、日、韩四语种的类型检测
✓ 通用高精模型:在通用文字识别的基础上,提供更高精度的识别服务,并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字
✓ 图片文字清晰,小幅度倾斜、无明显背光识别率高达90%
卡证类文字识别
✓ 个人证照:身份证识别、银行卡识别、行驶证识别、驾驶证识别、护照识别、户口本识别、出生证明识别、港澳通行证识别、台湾通行证识别、名片识别等
✓ 企业证照:营业执照识别、社会统一信用代码证识别、法人登记证识别、经营许可证识别、完税证明识别
✓ 等资产证照:车牌识别、机动车检验合格证识别、不动产证识别、开户证明识别等
票据类文字识别
✓ 财务票据:增值税发票识别、定额发票识别、机打发票识别、火车票识别、出租车票识别、行程单识别、购车发票识别等
✓ 银行票据:银行汇票识别、银行回单识别、银行支票识别等
✓ 保险单据:保单识别等
✓ 医疗票据:医疗发票识别、医疗费用清单识别、医疗结算清单识别、病历首页识别、出院小结识别等
✓ 支持行业票据定制化训练
通用类文字识别
✓ 表格识别:对单据或报表中的表格内容进行结构化识别
✓ 手写文字识别:对图片中的手写中文、手写数字进行检测和识别
✓ 网络图片识别:针对艺术字体或背最复杂的文字进行网络图片专项优化识别
✓ 数字识别:对图片中的数字进行识别
✓ 公式识别:对印刷公式进行识别
✓ 二维码识别:识别二维码并提取信息
✓ 仪器仪表识别:识别仪器仪表读数
✓ 印章检测:对合同文件或常用票据的印章进行检测并返回位置
自定义模板识别
✓ 自定义模板:只需上传一张模板图片即可自助制作识别模板,建立图片中文字的Key-Value对应关系,实现对相同版式图片的结构化识别
✓ 自定义分类器:为需要分类的卡证、票据每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类
✓ 自定义字段类型:针对输出值为有限集的字段,用户可上传字段词典限制该字段的输出值,系统会进行输出值的智能纠正匹配,提高识别准确率
身份验证:利用身份证识别配合活体检测、人脸对比等服务,同时对接权威数据源及验证服务,精确判断用户身份真实性文档电子化:对各类纸质文档及报表的识别,应用于纸质文件分类归档、信息统计分析、关键内容提取等场景
支持多种高精度票据识别模型、提供自定义票据识别、混贴报销单票据自动裁切和分类功能,为企业财会场景提供完整的OCR解决方案
通过OCR技术实现理赔环节的医疗票据和单据的结构化信息提取,提升理赔业务效率,降低理赔业务风险,减少人力成本,实现业务职能化升级
通过OCR技术实现理赔环节的医疗票据和单据的结构化信息提取,提升理赔业务效率,降低理赔业务风险,减少人力成本,实现业务职能化升级
基于图像技术识别驾驶证、行驶证、车牌、VIN码、购车发票、车辆合格证,提高用户输入效率,增强用户体验,应用于司机身份认证、车主信息认证,以及实现对车辆信息的自动识别等场景
百度OCR,每天处理几千万的图像文字反作弊请求,进行图像文字、视频文字反作弊,识别图片上面的违规文字
基于文字识别,进行中外文识别,而后通过NLP等技术实现拍照识别文字/翻译功能
基于生僻字的文字识别服务,支持20000大字库的识别服务,帮助生僻字需求用户识别文字