几种典型光学字符识别(OCR)技术的网络结构(二)

来源: 云巴巴 2022-11-21 15:51:18

 

     随着互联网的成长,各种软件涌入了我们的视线,怎么打光学字符识别(OCR)技术是如何实现图片转文本呢?主要是基于以下几种网络结构。

     一种常见的做法是调整候选锚定框,例如光学字符识别(OCR)技术在faster R-CNN的基础上,将垂直的候选锚定框进行旋转满足非垂直文本的检测,这样一来就可以满足非垂直文字的检测需求。

     光学字符识别(OCR)技术RRPN 的网络结构

     SSD是一个文本框改进算法。调整了发展锚定框的长宽比,以适应中国文字的高长宽比。使用输出层还使用非标准的卷积核,更适应中国文字细长的宽高比这一发展特点。

     光学字符识别(OCR)技术TextBoxes 的网络结构

     DMPNet使用四边形检测到非矩形块候选锚(深度匹配现有网络)。通过OCR Monte-Carlo方法进行计算数据标注不同区域。矩形候选框和旋转产生候选框的重合度后重新设计计算一个顶点位置坐标,得到非矩形四边形的顶点坐标。

     光学字符识别(OCR)技术DMPNet生成候选锚定框的示意图

     另一种方法是通过向顶底的方法,检测所述细粒度连接文本成文本更粗粒度的改进后CTPN是目前我国应用范围最广的文本进行检测系统模型方法之一。一个基本假设是,单个字符比更异构的文本行更容易检测,因此OCR作为首先为单个字符检测类似的R-CNNLSTM后来添加在双向网络检测时,形成的检测结果序列提供文本的上下文特征,它们可以被组合以得到多个文本字符线。

     光学字符识别(OCR)技术CTPN的网络结构

     Seglink的设计灵感来自SSD。方法连接相邻的连接上下文。并且可以通过将连接参数的学习资源整合进了神经系统网络的学习活动过程,使得模型更容易训练。

     光学字符识别(OCR)技术SegLink的网络结构

     一些研究推出注意机制,使用以下评价权重的密集关注模型图像模型。对于文本教学内容较之背景图像有着更高的注意力,OCR这样一个有利于将前景进行图像和背景图像分离,使检测研究结果更准确。

     如今,光学字符识别(OCR)技术还处于初期阶段,设备风险控制任重道远,腾讯光学字符识别(OCR)技术将不断挖掘其丰富其功能,不断打磨自身技术,帮助和辅助人们更好的工作,学习和生活。

     版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

腾讯云618活动,人脸核身1000次身份核验低至920元!

腾讯云618活动,人脸核身1000次身份核验低至920元!

腾讯云618活动为用户准备多重惊喜好礼!不仅有腾讯云618代金券,更多腾讯云618优惠活动欢迎咨询云巴巴严选云!

2022-11-24 13:57:53

Rpa有效提高流程质量和业务处理的准确性

Rpa有效提高流程质量和业务处理的准确性

RPA敏捷原因可以提高包括投资少,周期短,见效快,操作简单易学;除此之外,还有我们很多敏捷特征是在RPA实施过程管理中所体现的。 例如,由于机器人仿真的手动操作有很多细节,很难充分表达书面的需求声明,通常在开发过程中,需要业务人员和开发人员共同参与。 一

2022-11-22 15:27:58

AI变脸、人脸融合技术原来可以这样用(一)

AI变脸、人脸融合技术原来可以这样用(一)

相信不管是在App中还是一些微信里的H5界面,你也玩过AI变脸这样的小游戏吧。其实这些都是基于人脸融合技术的。 人脸融合技术是通过快速精准地定位人脸关键点,将用户上传的照片与特定形象进行面部层面融合,使生成的图片同时具备用户与特定形象的外貌特征,支持单脸

2022-11-23 17:13:50

“生物识别”之“掌纹”、“DNA”、“行为”

“生物识别”之“掌纹”、“DNA”、“行为”

本文将为您介绍“生物识别”中的“掌纹识别”、“DNA识别”以及“行为识别”等内容。     掌纹识别     手掌扫描仪可以同时通过进行分析识别手指长度和手掌宽度等几何信息技术特征,或者没有一个扫描手掌中独特的静脉图案来验证我们自己一个人的身份。  

2020-05-06 16:52:53

你知道什么是新时代下的智能运维吗

你知道什么是新时代下的智能运维吗

在技术管理系统进行转型发展过程中,智能运维有必要引入人工智能来辅助甚至可以部分替代人工智能决策,提升运维质量和效率。传统运维模式企业面临“安全生产运行、人力资源紧缺、远程运维”三大挑战。 操作和维护是确保系统的稳定运行的重要手段,智能运维的安全和技术系统

2022-11-22 10:14:57

蓝鲸标准运维中“轻应用”的这些功能你都知道吗?

蓝鲸标准运维中“轻应用”的这些功能你都知道吗?

标准运维通过与蓝鲸集成平台深度结合,业务运维人员将日常工作标准化后,以标准运维中一个模板的形式提供给业务非技术人员使用,为了降低使用者的操作风险和使用成本,将该模板以独立 SaaS 应用的方式指定给授权者使用。

2020-03-05 16:47:59

严选云产品

腾讯云SSL证书 SSL证书(SSL Certificates)又叫服务器证书,腾讯云为您提供证书的一站式服务,包括免费、付费证书的申请、管理及部署功能。通过与业界知名的数字证书授权(CA)机构合作,为您的网站、移动应用提供 HTTPS 解决方案。
腾讯会议Rooms 腾讯会议Rooms是专为会议室打造的软件系统,提供音视频会议、共享屏幕、触屏式白板的集成会议体验,开放音视频认证标准,臻选品牌硬件终端,共同为企业提供现代化的会议室解决方案。
思科工业以太网系列交换机 思科工业以太网2000 (IE2000)系列是一系列针对工业环境加固的紧凑型接入交换 机。IE2000系列采用思科弹性以太网协议(REP),为客户提供易用性、安全接入和 行业领先的收敛功能。
魔学院建筑行业企业培训解决方案 魔学院建筑行业企业培训解决方案为了解决员工参与度低,重理论轻实操以及时间预算不充足等问题,而达到多端灵活选择,同时达到学习需求可视化、知识资产可视化、学习成果可视化、员工成长可视化。
数影星球安全办公空间 数影星球安全办公空间,通过数影办公平台访问办公系统,自动实现数据和行为全管控,安全办公。实现账号密码自动托管和登录,员工不再掌控账密,无法脱离数影进行登录使用。敏感数据防导出,防下载,自动识别业务系统中的敏感数据,并进行自动化脱敏。
开源网安S-SDLC软件研发安全全流程管理平台 S-SDLC平台能够集成业界主流的安全检测工具的检测结果,除了开源网安自研Vulhunter、SourceCheck、CodeSec等安全工具外,支持集成Fortify、StackRox、Coverity等第三方工具。平台可以通过系统名称或者唯一编号进行模糊查询,或者通过系统级别、所属业务领域进行筛选。项目的相关漏洞数据可以通过漏洞名称、项目名称、项目版本、下属应用名称、检测工具、漏洞修复状态进行筛选。

甄选10000+数字化产品 为您免费使用

申请试用