基于优秀的基础核心能力,构建智能化的图像采集方案,实现自动化的业务流程
基于深度学习的OCR技术配合文本自动纠错功能,融合上下文语义技术,自动完成纠错和填充,提升识别精度。可以处理图像、PDF、DOC、DOCX多种格式的文档
识别覆盖全国所有省市版式,自动区分版式,无需手动选择,支持多格式识别,支持手机拍照图、扫描图、复印件的识别
文本智能提取系统为用户提供强大、灵活的的文本信息提取能力,可实现批量的、自动化的提取,可以大幅提升信息处理效率,辅助业务人员获取录入关键信息,降低人工疏漏带来的风险。用户可以灵活的定义合同提取模型,系统具备标注、训练学习的能力,快速实现模型生成和迭代。
财报识别解决方案核心能力:基于AI能力的OCR识别引擎,解决低分辨率下文字识别率低的问题;预置科目匹配词典,自动匹配纠正描述不一致的科目达到数据规范统一;预置科目平衡校验公式,自动进行项目的勾稽计算,实时提示配平;灵活定义输出模板,按照用户自定义输出模板导出报表数据。
平台可与公司现有的ESB(企业服务总线)、IAM(统一身份认证)系统进行集成,实现统一身份管理,实现ESB对所有交互接口的统一管理。
我们的优势:全部产品同时支持GPU环境、CPU环境、信创环境的部署,支持Linux、Windows、手机系统;对硬件消耗资源低,可在6G显存环境部署,16G显存至少5并发,同等GPU资源条件并发性能优于同行。
独立部署在用户服务器与系统对接,通过内网通信实现数据传输,文档数据均保留在用户私有的服务器上,保证数据安全。
用户目标:接入统一的OCR识别中台能力,构建金融AI中台
覆盖银行多业务场景下证件、票据、凭证单据的智能化采集,快速自动采集图像上的信息要素,有效代替人工录入和审核工作,降本增效。OCR能力可以部署到银行的AI中台,通过API直接对接到银行业务系统。
对于部分场景,可能内置模型达不到要求,比如一些特殊字体的支持等等,需要训练特定的模型以提高识别率,通过训练得到新模型,然后采用新模型构建OCR应用流程。