腾讯云智能内容识别平台_图像/视频标签系统_图像识别SDK

立即咨询

立即试用

商务合作

腾讯云智能内容识别平台

腾讯云智能内容识别平台主要提供辅助内容创作、创新的AI服务，主要包括内容理解、内容处理、内容生成。降低内容创作者的创作、创新门槛，提升创作、创新效率。

立即咨询

产品定位

定位

提供辅助内容创作、创新的AI服务，主要包括内容理解、内容处理、内容生成

目标

降低内容创作者的创作、创新门槛，提升创作、创新效率

产品矩阵

产品优势

效果领先
效果自然：领先的人脸生成类技术，在属性编辑、风格生成等方便拥有先进技术，使人像变换效果更加自然逼真。发丝级分割效果，不同场景下依然保持人像清晰自然鲁棒性强：换脸相似度、清晰自然度、开放场景适应性更强，有效解决侧脸模糊、正脸换脸痕迹明显等问题。

操作便捷
参数灵活：支持通过 API 调整细节参数，使面部处理更精细贴切，同时支持根据业务实际使用反馈随时调整。支持API+控制台管理，实现双人脸融合、素材管理和审核、自定义水印等差异化功能，方便对素材进行管理。自定义分割区域，灵活分离五官、脸部、头发等部位。

能力丰富
内容理解：拥有完善的标签体系，以更细粒度进行标签呈现，覆盖多个通用和细分领域，广泛适用于互联网娱乐、电子相册、融媒体等多元业务场景。针对不同类型的场景提供丰富多样的换脸服务。

快速集成
标准化API接口封装或者sdk。调用简单，集成快速。 API ：集成时间最快1天，最快从集成到采购只花3天。 Sdk：最快集成仅需1周，对于腾讯云音视频客户集成更便捷。

演进路线

由点到面：从图片人脸融合做起，逐步扩展到分割、变换等20+项原子能力，结合云+AI的优势构建起从内容理解、处理到生成的原子能力工具箱，支持客户一站式接入使用。由浅入深：从支持项目制的营销项目开始，逐步深入建立营销解决方案批量复制爆点活动，再拓展到图片视频编辑领域建立行业影响力，今年从消费级内容市场迁移到虚拟形象生成、影视内容生成等工业级内容市场，建立新的行业壁垒。

内容理解 · 图像/视频 icon

智能理解图片或视频内容，提供自动打标服务。包含以下两款子产品：图像标签：识别图片中的各种物体或场景等，返回具体的名称标签、所属类别和置信度等，覆盖日常物品、场景、动物、植物、食物、饮品、交通工具等多个大类，数百个细分类目，数千个具体标签。视频标签：通过对视频中视觉、场景、行为、物体等信息分析，结合多模态信息融合及对齐技术，实现高准确率内容识别，自动输出视频的多维度内容标签。

智创 · 内容理解 · 图像/视频标签 icon

智创 · 内容理解 · 图像/视频标签 icon

智创 · 内容理解 · 图像/视频标签 icon

视频推荐
提取丰富且高价值的内容标签，结合智能推荐技术将内容标签与用户标签进行精准匹配，打造“千人千面”的推荐系统。

媒资管理
可应用于企业媒资入库储存的通用场景，通过视频标签建立细分的内容框架结构，实现媒资素材的智能归类存储。

片段检索
通过标签有效概括视频画面、声音、内容大意等信息，帮助快速了解视频素材概况、定位相关片段，方便进行素材内容定位和资源再利用。

内容运营
根据素材的事件标签和人物标签，可快速搭建热点话题、热门人物的专题内容版块，降低专题素材汇总成本，提高内容运营的效率和质量。

智创 · 内容理解 · 图像搜索 icon

基于图像检索、超细粒度元素挖掘和图像匹配等技术，通过以图搜图的方式在自建图片库中快速检索出与输入图片相似的图片集合。包含以下三款子产品：

相同图像搜索
通用场景下的原图搜索，输入图片，在用户自建的图库中搜索相同原图或高度相似的图片，可支持经过裁剪、翻转、模糊、扭曲、滤镜调色、加水印等二次编辑后的图片搜索。

相似图像搜索
输入包含某种图案或其他元素的图片，在用户自建的图库中搜索相似的图案、logo、纹理等图片。

商品图像搜索
输入商品图片，在用户自建的图库中搜索同款商品图。

智创 · 内容理解 · 图像搜索 icon

相同图像搜索：用于通用图搜场景下的原图等搜索基于输入检索的图片全图，在用户自建图片库中搜索相同原图或高度相似的图片集，并给出相似度打分，可支持经过裁剪、翻转、模糊、扭曲、滤镜调色、加水印等二次编辑后的图片搜索。

智创 · 内容理解 · 图像搜索 icon

相似图像搜索：针对图案的搜索。针对输入检索的图片中包含的图像元素或主体，例如图案、logo、纹理等，在用户自建图片库中搜索与之相似的元素图片，并给出相似度打分。

智创 · 内容理解 · 图像搜索 icon

商品图像搜索：针对同款商品的搜索基于输入检索的图片，可智能识别图片中的商品主体，在自建图片库中搜索相同或相似的商品图片，并给出相似度打分。如果输入检索的图片包含服饰类商品，可智能识别上衣、下装、裙装、鞋、包、配饰等多种服饰的类别、颜色以及其他特征属性。

智创 · 内容理解 · 图像搜索 icon

智创 · 内容理解 · 图像搜索 icon

版权图库、内容平台

图片版权保护，图片侵权打击

电商平台

商品搜同款，电商侵权审核

典型案例

版权图片保护 —— 河图创意图片库

河图创意图片库为中国摄影师提供了原创作品的版权保护平台。支持：

1. 将自建版权图库和自建网图库做比对和筛查

2. 为用户提供侵权检测功能图像搜索技术有效保护了图片版权，多类图片场景中，在误识率千分之一情况下，已达到召回率94%的表现。

典型案例

电商侵权审核 ——某大型国际电商平台

电商平台对品牌logo、版权图案、原创花纹等图像元素进行侵权审核，及时发现内部设计作品是否抄袭了市面上已有的其他设计，提升侵权审核效率。在误识率千分之一情况下，召回率达到80%以上。电商搜同款 —— 某奢侈品电商平台

消费者拍照或上传图片后，智能识别商品主体并在后台商品库中快速找到同款或相似商品，提升消费者的购物效率与体验。

典型案例

数字化展览 —— 故宫腾讯沉浸式数字体验展

故宫和腾讯联合主办：“纹”以载道——故宫腾讯沉浸式数字体验展。其中，巧思成“纹”展项运用了图像搜索技术。该展项设计了360度环幕展示故宫院藏精品文物。屏幕上，每个文物上有2种纹样，结合一个纹样即为一个“纹样线索”，可跟随此线索到下一个拥有同样纹样的文物中。腾讯优图图搜技术，实现了从海量数据中定点发现含有特定视觉元素的图像数据。通过对近600件文物素材的识别和检索，引导用户认识国宝、走近国宝。

典型案例

IP侵权检测 —— 微信小游戏平台

图像搜索运用于微信小游戏侵权保护系统，对数万款游戏进行筛查和审核，防止侵权行为。对于系统的侵权事件达到98%的召回率和85%的准确率，极大地减少了全过程的人工介入，大幅提升侵权识别的准确率和效率，是对以往手工分拣侵权事件的一次技术革新。图像搜索在微信小游戏的审核拦截、线上检测等环节都发挥着重要作用，已成功处理500多例侵权事件。

针对不同细分领域提供专业性的图像智能识别服务 icon

车辆识别

车辆识别API 可对图片中车辆位置，以及品牌、车系等车辆属性信息进行识别。车辆识别（增强版）API 可对图片中车辆位置、车辆属性信息、车牌信息进行识别。

商品识别

商品识别API 可识别图片中包含的商品，输出商品品类名称、类别和商品在图片中的位置。商品识别（微信识物版） API 可识别出图片中的主体位置、主体商品类型，覆盖亿级SKU，输出具体商品的价格、型号等详细信息。

文件封识别

检测图片中是否包含符合文件封特征的物品，覆盖物流企业专用快递文件封、通用文件袋、通用档案袋等多种文件封类型。

宠物识别

输入图片，输出猫狗在图像中的坐标位置以及置信度。

敬请期待

安全属性识别：安全帽，手机，抽烟，口罩，工地安全带，反光衣

厨师穿戴属性

厨师服，厨师帽，赤膊，口罩

典型案例

门店车辆识别 —— 某车辆服务门店

车辆服务行业存在交易飞单情况。通过车辆识别增强版能力对所有到店的车辆进行车辆属性和车牌信息的识别和记录归档，通过和系统登记的车辆信息做对比，发现异常情况进行进一步调查处理，有效防止飞单带来的营业额损失。经验证车牌识别的准确率达95%，接口通过多次模型优化和策略优化能有效应对室内场景角度较大、遮挡、模糊等复杂情况。

文件快递揽收审核 —— 某物流企业

对文件快递的包装审核等场景。在快递员揽收完文件后，会要求对装有信封的文件封进行拍照存证。然而某些场景下，存在揽收失误导致的文件封误装，或者快递员因为时间紧张或偷懒乱拍的可能，此时需要AI识别文件封照片是否正确拍摄。快递员通过手机拍摄封装好的文件封上传至云端，审核通过后可以进行后续动作。

智创 · 内容处理 · 人像分割 icon

对图片或视频中的人体轮廓范围进行识别，将其与背景进行分离，实现精细化抠图的效果。包含以下三款子产品：图片二分类人像分割：识别图片中完整的人体轮廓并将其与背景进行分离，对图片中无正脸、侧脸、背影，单人，多人等可实现分割。图片多分类人像分割：在图片前后景分割的基础上进行多分类分割，支持对头发、五官、头部等21种类目信息的分割，既可作为换发型、挂件等底层技术，也可用于抠人头、抠人脸等玩法。视频人像分割：识别视频流中的人体轮廓并将其与背景分离，可满足单人、多人、半身、全身、无人脸、侧脸等多种不同场景，提供离线SDK、API等部署方式。

应用场景

图片/视频编辑工具

对上传的人物图片、视频进行实现一键抠像、背景替换、人像虚化等后期特效处理，帮助节约时间及成本。

直播/会议背景替换

自动识别人像、分离人像，将背景环境替换为指定的图像或视频。营销活动

基于人像分割开展多元的AI互动体验活动，增强可玩性，提升营销效果。

典型案例

虚拟背景替换（直播/线上课堂/在线会议） —— 腾讯会议

自动识别参会人，并将参会人周围的环境替换为指定图像或视频。一方面，使用虚拟背景能对参会人员的隐私进行保护；另一方面，虚拟背景能起到取代布展背景墙的作用，有利于会议的主题宣传以及会议成本的节约。

活动营销、线下互动 —— 进博会《“我与新中国” 合照留影》

在进博会国家展中国馆展区中，国家商务部外贸发展事务局携手腾讯微信团队，借助腾讯云和优图实验室的人脸融合、人像分割两大能力，共同打造线上线下AI互动小程序——“我与新中国”。用户可以在现场通过自己的手机操作小程序，体验换景自拍、换装自拍等功能，现场用户生成的照片将会实时显示在大屏幕的“照片背景墙”中。

智创 · 内容处理 · 人脸试妆 icon

提供多种美颜美妆功能，打造自然清晰的人像处理效果。包含以下三款子产品：试唇色：对人脸图片进行唇部彩妆替换，实现唇部色彩自然融合处理。同时支持在视频流中进行唇色的选择和替换，色彩还原度、素材贴合度更高，带来更好的试妆效果。图片滤镜：对图片进行滤镜处理，支持七十多种不同风格的滤镜效果，包含日系、甜美、质感、清新等滤镜。效果自然适用不同表情、性别、年龄、姿态、光照条件，美妆美颜效果处理自然，打造无暇妆容。调参灵活支持通过 API 调整细节参数，使面部处理更精细贴切，可根据业务实际使用反馈随时调整。

应用场景

线上美妆零售

可用于在线试口红等虚拟试妆场景，用户通过智能终端即可体验最接近本人真实情况的唇色效果，节约用户线下购买时间，降低商家的运营成本。

美颜相机

可用于美妆相机、手机自拍修图等人像美化场景，一键智能实现美白、磨皮、大眼、瘦脸、美型等人像美颜效果和不同风格的滤镜效果，帮助快速打造精致五官，提升个人社交形象。

证件照制作、美化 —— 某头部证件照小程序

对用户上传的照片进行发丝级抠图，支持自由切换证件照底色，同时提供磨皮、美白等智能精修美颜服务，让证件照变得更加美观。

智创 · 内容处理 · 3D人脸重建驱动 icon

通过人脸3D重建技术，依靠用户2D人脸图像估计精确的人脸3D姿态和表情，进而驱动虚拟3D形象进行相应的姿态表情变化，达到高精度人脸表情驱动的目的。输入输出：输入一张人脸图片/一段人脸视频。输出重建结果及表情系数，驱动3D人脸虚拟Avatar。接入方式：支持多端口接入，包括安卓端、IOS端和Win端。

应用场景

特效挂件（直播、短视频、美颜相机、活动营销）

精准检测照片中的眼睛、口鼻和轮廓并智能跟随，完成2D/3D素材贴纸的贴合并输出贴合特效挂件后的视频，支持单人及多人模式。形象制作（游戏捏脸）

玩家上传照片，系统生成与之相似的形象，并在此基础上完成捏脸的形象设计。

典型案例

游戏形象制作 —— 天涯明月刀3D游戏捏脸

捏脸系统在游戏中可以满足玩家订制角色的心愿，增强游戏的趣味性。但是从零捏出一张心仪的人脸，对普通玩家来说挑战较大，目前有两种常见的解决方案：

1. 预设已经捏好的模板人脸供玩家在此基础上微调

2. 玩家上传照片，系统自动捏脸 3D人脸重建驱动算法主要服务于第二种方案，即用户上传一张或多张照片，系统生成非常相似的形象，设计师在此基础上实现从现实世界的人脸到游戏世界的人脸之间风格的转换，提高捏脸效率和趣味性。

智创 · 内容处理 · 图像处理 icon

基于深度学习等人工智能技术，提供综合性的图像优化处理服务。包含以下子产品：图像质量评估：评估输入图片在视觉上的质量，给出综合的、客观的清晰度评分，和主观的美观度评分。图像清晰度增强：消除图片因有损压缩导致的噪声，改善因使用滤镜、拍摄失焦等导致的图像模糊问题，让图片的边缘和细节更加清晰自然。图片智能裁剪：根据输入的裁剪比例，智能判断一张图片的最佳裁剪区域。黑白图片上色：给定一张给白图像，输出上色后的结果