图像识别技术所面临的机遇和挑战

来源: 云巴巴 2022-11-22 16:11:40

    对于人类来说很容易识别图像,但对机器来说图像识别也经历了很长时间的发展。

    在计算机视觉的领域,图像识别近年来得到长足发展。例如,在PASCAL VOC物体进行检测技术基准系统测试中,检测器的性能从企业平均模型准确率30%飙升到了我们今天的超过90%。对于图像分类和图像识别,在机具挑战性的ImageNet数据集上,先进的算法甚至超过了人类目前的表现。

 
精准识别超过十万种物体和场景,包含多项高精度的识图能力并提供相应的API服务,充分满足各类个人开发者和企业用户的业务需求

    大规模数据集的生成、强大模型的开发和大量可用的计算资源是深度学习的成功主要得益于的三个方面。设计深度神经网络已经远远超越了以前基于人工设计的图像识别特征,对于多种图像识别任务来说。图像识别信息技术的高价值以及应用就发生在你我身边,例如通过视频监控、自动驾驶和智能发展医疗等,而这些图像识别最新研究进展的背后推动力是深度合作学习。

    深度合作学习在图像识别技术方面发展就目前来说虽然已经取得了一个巨大成功,不过在它进一步广泛应用之前,仍然还有很多挑战自己需要我们去面对。与此同时,我们在图像识别身上也看到了很多的研究具有未来价值。

    图像识别技术在可以被广泛应用之前,怎样才能知道一个系统模型对未曾出现过的场景仍然具有很好的泛化能力,是一个非常重要的挑战。

    图像识别在目前的实践中,将数据集随机分为训练集和测试集,并对模型进行相应的训练和评估。需要注意的是,在这种方法中,由于它们都是从具有相似场景内容和成像条件的数据中采样获得,所以测试集拥有和训练集一样的数据分布。

然而,在实际发展应用中,测试图像或许会来自不同于训练时的数据主要分布。这些未曾出现过的数据在图像识别方面可能会与平时数据的视角、规模、场景配置、大小尺寸、摄像机属性有所不同。

    目前来说,图像识别重要研究的领域是将常识融入到深入学习中,深度学习主要作为一种纯粹的数据进行驱动技术被我们使用。在深度学习,使用标记的样品的训练集学习的非线性函数的神经网络,这个角色后,学习功能将在测试图像像素,训练集之外的信息则一点也没有被我们所用到。

    相反,人类对物体的图像识别不仅基于已经看到的样本,而且还基于它们对现实世界的常识。人们能够推理他们所看到的,为了避免识别结果不符合逻辑的。如何在深度网络中获取、表示常识和使用常识推理是一个挑战。

版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

一小时搞定数十条数字人视频?闪剪带你领略AIGC时代的高效制作!

一小时搞定数十条数字人视频?闪剪带你领略AIGC时代的高效制作!

新时代,每个人都要学会用AI工具创作内容,作为国内领先的AI视频制作工具研发商,闪剪就是一套很好的辅助视频生产的AI工具系统。

2024-10-16 17:03:39

图像识别技术在安防应用中功不可没

图像识别技术在安防应用中功不可没

们正处于技术发展有着决定性的影响的时代,技术变化如此之快,我们几乎无法跟上它的步伐,更别说预测未来。其中有着强大的影响力和吸引力的技术之一就是图像识别了,可谓是发展迅速。 什么图像识别?简言之,使用计算机执行图像处理,分析和理解,来识别不同模式目标和对象

2020-04-21 17:18:44

这些行业更适合使用腾讯云人脸特效技术

这些行业更适合使用腾讯云人脸特效技术

在我们的生活中,会接触很多的人工智能技术,而本文,就和朋友们一起讲解一下,腾讯云人脸特效技术更适合被应用哪些行业。 金融、互联网、媒体、广电、政府等各类大型公司、机构在应用人脸特效技术时更多的使用场景是营销活动、节假日庆祝和各种周年庆。

2022-11-24 11:13:40

光学字符识别(OCR)是如何进行文字检测

光学字符识别(OCR)是如何进行文字检测

近年来,我们的生活和工作与网络之间的关系越来越密切了。现在,人们的版权意识也变得越来来越强了。这是好事,但是当我们急切的想改一下自己的PDF格式文件时,就要用到本文要介绍的主角了光学字符识别(OCR)技术。

2022-11-21 15:51:27

百度智能云数字员工让金融服务更加温暖

百度智能云数字员工让金融服务更加温暖

人工智能技术在如今看来已经开始变得无处不在,以金融市场分析师、导购、营销能手和服务生等各种身份,扮演着一个我们生活中重要的“伙伴”,甚至是工作上出色的“同事”。

2022-11-22 16:53:22

简述RPA原理和产品形态

简述RPA原理和产品形态

回顾过去几年,RPA快速发展,并且赢得了众多企业的投资,目前,RPA已在金融、财会、电信、能源、制造业、物流等行业领域生根发芽。

2020-03-18 17:38:23

严选云产品

深信服数字应用安全平台DASP 深信服数字应用安全平台aSecPaaS,针对多种应用模式,覆盖缺陷修复、数据安全、移动应用安全等多场景,在开发编码过程中勾选集成相应的安全SDK能力即可实现应用安全需求。
苏京智能 铁路智能巡检机器人解决方案 苏京智能铁路智能巡检机器人解决方案,巡检机器人可以在第一时间切入机房现场,掌握机房状况 。巡检机器人通过执行灭火应急等相关的处置措施,确保机房的安全,在工作人员之前解决问题,起到防灾减灾效果。提高机房管理自动化水平和工作效率提供 了有效的手段,大大节省人工投入成本。
腾讯云数据库应用服务迁移DTS DBbridge 数据库应用服务迁移(DTS-DBbridge)是一款支持异构数据库之间、同构数据库之间进行数据同步的企业级产品。通过DTS-DBbridge可以帮助企业实现在线数据库同步,满足企业多样化数据传输、数据汇聚、数据灾备等业务场景,帮助企业建立数据之间的流动,打造数据间的互联互通。
OgCloud跨境电商解决方案 OgCloud聚焦电商场景,细分垂直场景,提供专业的解决方案,推出智慧电商、跨境电商两大场景解决方案,1v1全栈式服务,促进企业营销模式创新并加速推动企业数字化转型。
ITC智能公共广播系统 T-6232A编程分区控制器广播系统是一套支持160个功率分区的公共广播系统,系统由编程分区控制器、十分区矩阵器、消防智能接口器、强切电源、远程寻呼站主要核心设备组成,主要功能有背景音乐、业务广播、业务寻呼广播。
声网Agora全链路加速FPA 全链路加速 FPA(Full-Path Accelerator)基于SD-RTNTM,通过网络智能、路由规划调度、多路冗余等方式,结合关键节点广泛部署,有效地解决了因网络拥塞、运营商故障等带来的传输质量下降问题,实现了全球质量保障的归一化。通过终端SDK实现了弱网对抗、智能接入等能力,大幅提高了对LastMile质量不佳的适应性。

甄选10000+数字化产品 为您免费使用

申请试用