由点到面:从图片人脸融合做起,逐步扩展到分割、变换等20+项原子能力,结合云+AI的优势构建起从内容理解、处理到生成的原子能力工具箱,支持客户一站式接入使用。 由浅入深:从支持项目制的营销项目开始,逐步深入建立营销解决方案批量复制爆点活动,再拓展到图片视频编辑领域建立行业影响力,今年从消费级内容市场迁移到虚拟形象生成、影视内容生成等工业级内容市场,建立新的行业壁垒。
智能理解图片或视频内容,提供自动打标服务。包含以下两款子产品: 图像标签:识别图片中的各种物体或场景等,返回具体的名称标签、所属类别和置信度等,覆盖日常物品、场景、动物、植物、食物、饮品、交通工具等多个大类,数百个细分类目,数千个具体标签。 视频标签:通过对视频中视觉、场景、行为、物体等信息分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签。
基于图像检索、超细粒度元素挖掘和图像匹配等技术,通过以图搜图的方式在自建图片库中快速检索出与输入图片相似的图片集合。包含以下三款子产品:
相同图像搜索:用于通用图搜场景下的原图等搜索 基于输入检索的图片全图,在用户自建图片库中搜索相同原图或高度相似的图片集,并给出相似度打分,可支持经过裁剪、翻转、模糊、扭曲、滤镜调色、加水印等二次编辑后的图片搜索。
相似图像搜索:针对图案的搜索。针对输入检索的图片中包含的图像元素或主体,例如图案、logo、纹理等,在用户自建图片库中搜索与之相似的元素图片,并给出相似度打分。
商品图像搜索:针对同款商品的搜索 基于输入检索的图片,可智能识别图片中的商品主体,在自建图片库中搜索相同或相似的商品图片,并给出相似度打分。如果输入检索的图片包含服饰类商品,可智能识别上衣、下装、裙装、鞋、包、配饰等多种服饰的类别、颜色以及其他特征属性。
对图片或视频中的人体轮廓范围进行识别,将其与背景进行分离,实现精细化抠图的效果。包含以下三款子产品: 图片二分类人像分割:识别图片中完整的人体轮廓并将其与背景进行分离,对图片中无正脸、侧脸、背影,单人,多人等可实现分割。 图片多分类人像分割:在图片前后景分割的基础上进行多分类分割,支持对头发、五官、头部等21种类目信息的分割,既可作为换发型、挂件等底层技术,也可用于抠人头、抠人脸等玩法。 视频人像分割:识别视频流中的人体轮廓并将其与背景分离,可满足单人、多人、半身、全身、无人脸、侧脸等多种不同场景,提供离线SDK、API等部署方式。
提供多种美颜美妆功能,打造自然清晰的人像处理效果。包含以下三款子产品: 试唇色:对人脸图片进行唇部彩妆替换,实现唇部色彩自然融合处理。同时支持在视频流中进行唇色的选择和替换,色彩还原度、素材贴合度更高,带来更好的试妆效果。 图片滤镜:对图片进行滤镜处理,支持七十多种不同风格的滤镜效果,包含日系、甜美、质感、清新等滤镜。 效果自然 适用不同表情、性别、年龄、姿态、光照条件,美妆美颜效果处理自然,打造无暇妆容。 调参灵活 支持通过 API 调整细节参数,使面部处理更精细贴切,可根据业务实际使用反馈随时调整。
通过人脸3D重建技术,依靠用户2D人脸图像估计精确的人脸3D姿态和表情,进而驱动虚拟3D形象进行相应的姿态表情变化,达到高精度人脸表情驱动的目的。 输入输出: 输入一张人脸图片/一段人脸视频。 输出重建结果及表情系数,驱动3D人脸虚拟Avatar。 接入方式: 支持多端口接入,包括安卓端、IOS端和Win端。
基于深度学习等人工智能技术,提供综合性的图像优化处理服务。包含以下子产品: 图像质量评估:评估输入图片在视觉上的质量,给出综合的、客观的清晰度评分,和主观的美观度评分。 图像清晰度增强:消除图片因有损压缩导致的噪声,改善因使用滤镜、拍摄失焦等导致的图像模糊问题,让图片的边缘和细节更加清晰自然。 图片智能裁剪:根据输入的裁剪比例,智能判断一张图片的最佳裁剪区域。 黑白图片上色:给定一张给白图像,输出上色后的结果
手写识别是平安科技依托深度学习及海量图像样本积累,自主研发的一套智能图像信息提取系统。不仅支持票据类、卡、证上手写文字信息提取,同时支持对扫描文档、表格等图像中结构化的手写文字信息提取,在图像分类等功能上也具有业界领先的准确率。
丰富场景
功能完备
高可用
腾讯云文字识别(基于行业前沿的深度学习技术,将图片上的文字内容智能识别成为可编辑的文本。支持通用文字、卡证文字、票据单据、汽车相关、行业文档等多场景下的印刷体、手写体文字识别
支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别
提供定制化服务,可以有效地代替人工录入信息
印刷体的平均准确率可达90%以上,手写体的识别平均准确率高达85%以上