icon为什么金融文档需要更智能的技术来处理icon

我们开展为期数月的用户调研,并阅读与校验了上万份募集说明书、招股说明书等文档,统计出如下数据:

71%的文档存在尾差错误

报告中表格内数据一般来源自Excel表格,但编写文档用的Word文档没有Excel中的函数计算与保留两位小数功能,数据迁移时容易造成尾差。

100%的文档会出现文字、数字与标点错误

文档信息全部手打,容易多字、漏字,由于编写人语言习惯问题,容易造成不符合汉语规则的词汇与用法出现,报告中涉及的数字需添加千分位符,在Office软件中手打出错率极高。

53%的文档存在财务数据上下文冲突

不同表格内统一科目数字可能存在尾差,单位换算时容易出错,手打文档时经常出现单位漏填的情况,数字格式错误也会造成上下文不一致。

icon什么是财债通icon
文档纠错
语义纠错
文字标点纠错
财务一致性审核
表内数据纠错及指标核算
数据上下文一致性提示
文档风险审核
披露完备性审核
多文档不一致比对
icon产品功能概览icon
icon功能详解-文档纠错icon

文档纠错是一款主要对债券募集说明书、招股说明书、上市公司年报等文档内的文字、标点,以及数字格式进行筛查与纠错,并结合语义理解与债、股、财务会计相关语料,及《物权法》、《证券法》、《公司法》、《票据法》等相关规定,对文档实行全面纠错的功能,纠错准确率可达。

icon功能详解-文档纠错icon
语义重大误解

我们发现,文档中经常出现因增加或减少否定词而造成的语义误解错误,达观数据财债通产品不仅可对上下文的语义矛盾进行纠错,还可结合债、股、财务会计相关语料,及《物权法》、《证券法》、《公司法》、《票据法》等相关规定,较为准确的找出可能造成语义重大误解的错误。

上下文语义矛盾错误

“本公司全体董事、监事、高级管理人员承诺本募集说明书存在虚假记载、误导性陈述或重大遗漏,并对其真实性、准确性、完整性承担个别和连带的法律责任。”

专业知识重大误解错误

“(限制出售/转移重大资产):在本期债务融资工具存续期间,如果发行人拟出售或转移重大资产或重要子公司或通过委托管理协议等其他形式不再将重大资产、重要子公司纳入合并报表(该类资产单独或累计金额超过发行人最近一年或季度经审计合并财务报表的净资产10%及以上,该类子公司单独或累计营业收入或净利润贡献超过发行人最近一年经审计财务报表营业收入或净利润的30%及以上),需事先召开债务融资工具持有人会议,并经持有人会议表决同意,主承销商有义务提示并协助发行人召开持有人会议。出席持有人会议的债务融资工具持有人所持有的表决权数额应达到本期债务融资工具总表决权的2/3 以上,会议方可生效;持有人会议决议应当由出席会议的本期债务融资工具持有人所持表决权的3/4 以上通过后生效。如果出席持有人会议的未达到上述比例要求,应召开第二次会议,对于第二次会议仍未未达出席比例要求,视为同意发行人拟做出的上述行为。”

icon功能详解-财务一致性审核icon

单表格纠错:单表格纠错是单个表格为单位,对表格内的数值以某些逻辑关系纠错的一项功能,主要可分为两大纠错类型:一般合计类纠错,主要对表格内的合计、小计、总计等数值进行纠错,运算数据不拘泥于财务数据。表格内财务指标纠错,如利润表中的营业利润纠错、现金流量表中的现金流量净额纠错等。

根据左图,总投资的合计应为:
城区道路建设项目+莒南一中建设工程项目+城区基础设施建设项目+鸡龙河治理改造项目 +涛坪线路基工程项目 =8.87+3.64+1.50+3.20+4.13
=21.34 ≠ 16.75
根据左图,红框内年份的投资活动现金流量净额应为:
投资活动现金流入小计-投资活动现金流出小计
=300.00-17,859.47
=-17,559.47 ≠ -17,859.47
icon功能详解-财务一致性审核icon

多表格及表文披露纠错:多表格及表文披露纠错是一项对报告中的财务数据进行上下文一致性审核的功能,主要分为以下方面:

从校验对象所处的格式来看 多表格及表文披露纠错分为
a)表格数据与表格数据比对
b)表格数据与文章段落内披露信息比对
c)文章段落内披露信息之间比对
从校验对象的性质来看 该项功能可涵盖如下方面
a)财务主表数据的一致性审核,如固定资产净额、归属于母公司所有者权益合计、净利润的一致性审核等。b)非财务主表的财务数据一致性审核,如有息负债金额、受限货币资金、长期借款中信用借款金额的一致性审核等,涉及字段近千个。c)财务指标数据的一致性审核,如资产负债率、EBITDA、应收账款周转率的上下文一致性审核等。
icon功能详解-财务一致性审核icon

如左图,发行人2017年其他流动资产为636,611.27万元,而右图中发行人2017年其他流动资产则为636,611.27元,表肩的单位错误而导致财务数据上下文冲突。

icon功能详解-财务一致性审核icon

如上图显示,左图中红框内的数字为2017年末发行人其他应付款的金额,而右图的文字描述中,红框内的数字虽字面意思上为发行人2017年末其他应付款的金额,但由于其标题为长期应付款,从两个金额不一致可判断是右图科目写错而造成的冲突。

icon功能详解-财务一致性审核icon

如上图显示,左图中红框内的数字为2017年末发行人资产总计的金额,单位为万元;而右图的文字描述中,红框内的数字同样为2017年公司总资产的数字,单位却是亿元,从而造成冲突。

icon功能详解-财务一致性审核icon

如上图显示,左图中红框内的数字为2015年度财务费用的金额,数字为203,066.82万元,而右图中虽然显示2015年发行人财务费用的金额,但数字为203,066,82万元,将原本的小数点写成了千分位符,导致产生非正确的数字格式,进而造成冲突。*注:该类错误在“文档纠错-数字格式纠错”功能中也可得到校验与纠正。

icon功能详解-财务一致性审核icon

占比及变动披露纠错:债券募集说明书、招股说明书、上市公司年报等文档经常需要对一些主要财务数据进行披露分析,因此会有较多的占比与变动额吉变动率的披露 分析。由于篇幅较多,且作为计算基准的原数据可能篇幅较远,从而造成较大的错误披露风险。达观数据财债通产品从这一需求出发,提供了对报告披露中占比及变动披露信息的纠错功能。

如左图,2016年发行人投资活动产生的现金流量净额下降率应为: (-78,518.19-89,113.19)/89,113.19
=-188.11%
≠ 188%
如左图,2018年末其他应付款较2017年末增加额应为 (158,450.65-114,188.54)/114,188.54
=44,262.11
≠44,262.43
icon功能详解-财务一致性审核icon

财务指标核算:财务管理学科中常用财务指标来显示企业的偿债能力及盈利能力等,如资产负债率、流动比率、速动比率、EBITDA、净资产收益率等,这些财务指标在债券募集说明书与招股说明书等文档中也会披露,财债通产品综合文中的财务指标公式对其进行进一步的校验与纠错,从而找出错误,规避风险。如上图,流动比率的公式为:流动比率=流动资产/流动负债。从图2及图3的资产负债表得知,2015年末流动资产合计为2,341,505.40,流动负债合计为835,036.94。因此图1中2015年末的流动比率应为2,341,505.40/835,036.94=2.80 ≠2.81。

icon功能详解-招股说明书与审计报告交叉核验icon

场景说明:在实务中,券商需要拿到会计师事务所出具的审计报告草稿来填写招股说明书中关于注册会计师审计意见等内容的文字叙述,并根据审计报告中提供的财务主表及附注信息来编写招股说明书中的财务数据及变动披露分析,但由于种种客观原因,注册会计师提供的审计报告草稿可能会涉及审计调整,并更改审计报告草稿,投行员工因此需要又一次改动招股说明书,并谨慎规避因改动数字而造成的上下文不一致风险,该项工作繁琐且耗时耗力,财债通产品在传统比对功能的基础上进行了优化,从文字与数字角度,对招股说明书与审计报告的响应内容进行比对。

icon功能详解-招股说明书与审计报告交叉核验icon

如上图,左侧的招股说明书合并资产负债表中,2018年底货币资金的金额为1,014,180,753.61元,右侧审计报告里列示的合并资产负债表中,2018年底货币资金的金额为1,214,180,753.61元,二者数字不一致,结果在右侧的红框内的校验结果中可查看。

icon功能详解-招股说明书与审计报告交叉核验icon

如上图,左侧的招股说明书的会计师审计意见中显示,注册会计师出具的是保留意见的审计报告,而右侧审计报告中的文字描述表明,注册会计师对该公司出具的审计意见类型为标准无保留意见报告,二者不一致。*注:由于审计报告不会直接显示“无保留意见”、“保留意见”、“无法表示意见”等字样,财债通产品对审计报告中的审计意见进行映射,将文字描述中表示审计意见的内容映射成“无保留意见”、“保留意见”,及“无法表示意见”,并与招股说明书中的内容进行比对。

icon功能详解-科创板招股说明书完备性审核icon

场景说明:随着科创板的逐渐实行,中国证券监督管理委员会于2019年第一季度颁布了【第6号公告】《公开发行证券的公司信息披露内容与格式准则第41号——科创板公司招股说明书》,其中规定了科创板招股说明书应披露的内容,财债通产品仔细研读41号准则,对科创板招股说明书中不符合准则规定的内容予以风险提示。根据41号准则第43条,发行人应披露董事、监事、高级管理人员及核心技术人员的简要情况,包括姓名、国籍及境外居留权;性别、年龄、学历及专业背景、职称;主要业务经历及实际负责的业务活动;对发行人设立、发展有重要影响的董事、监事、高级管理人员及核心技术人员,还应披露其创业或从业历程;曾经担任的重要职务及任期;现任发行人的职务及任期。如图,图中披露了高级管理人员,但下文未全部披露五位高级管理人员的相关信息,因此报错显示。

icon功能详解-其他功能icon
icon特有功能-审核逻辑个性化定义icon

若会计准则发生变化,需要更改校验规则?财债通产品底层平台中内置常用的财务校验规则,可覆盖大部分报告中的财务逻辑,但当会计准则发生变化时,用户也可在界面中配置校验逻辑,灵活性较强。

icon特有功能-交叉校验规则定制化开发icon

若需要比对的不是审计报告,而是其他非公开文档?在实务中,招股说明书中除审计报告外,还有一些内容是从其他非公开文档中迁移而来,如《持有人会议规则》、《受托管理协议》等。当这些文档需要交叉校验时,财债通产品也可对该部分校验进行定制开发。

icon特有功能-支持校验结果再审核与再校验icon

若校验的科目定位不准确?如财务一致性审核中,出现科目定位误判时,财债通产品可支持用户二次修改科目与主体内容,并支持二次校验。财债通产品在审核时,按照 “年份”、“主体”、“科目”、“金额”来定位一个财务数据,并据此进行校验,当该定位出现误判时,我们可支持用户对这四个维度进行修改,并在点击产品界面中“重新校验”的按钮后,即可规避该误判。此外,后台将启动机器学习机制,达到一定量样本训练后可规避该误判。

icon产品优势分析-语料积累icon

应用:财务一致性审核,文档纠错。如:a) 超短期融资债券->超短期融资券b) 客户存款和同业存款项净增加额->客户存款和同业存放款项净增加额c) 资产抵押、质押、出售、转让、划拨或报废 ->资产抵押、质押、出售、转让、划转或报废

icon产品优势分析-技术优势icon

强大先进的底层技术:结合最先进的自然语言处理技术与深度学习技术,文档处理智能化水平高。利用文档智能审阅平台的抽取、审核、比对等功能,平台成熟,准确率高。达观数据拥有强大的文档智能审阅平台,运用当下最先进的自然语言处理技术(NLP),以及深度学习技术,文档处理更智能、更准确。

icon产品优势分析-业务与部署icon
强大的业务专家团队
财债通产品设计由长期从事审计、会计、投行业务的团队提供专业意见,业务梳理明晰且强大。
开箱即用,部署灵活
由于财务逻辑通用,财债通产品可直接使用,基本功能无需定制开发,并可提供API接口,部署灵活。
icon产品优势分析-可支持定制化开发icon
支持定制化开发
财债通产品可根据用户需求进行 定制化开发,如年龄校验、数据 逻辑趋势校验、非公开文档比对 等。
支持定制化开发
财债通产品在现有功能的基础上也可支持定制化开发,以满足用户不同校验的需求。例如:董事、监事、高级管理人员披露中的年龄校验。与发行有关的机构和人员相关信息的校验,如电话号码、传真信息校验。财务数据中对数据趋势描述的逻辑校验。债券募集说明书与《持有人会议规则》、《受托管理协议》等非公开文档交叉核验……
icon产品功能优势分析icon
文档类型全

财债通产品可支持PDF、doc、docx格式的文档校验,支持的文档格式基本覆盖了被审核材料的文档类型。

字段与公式全

财债通产品支持的字段不仅包括财务主表科目,还有非财务主表科目,如受限货币资金、有息负债等。所校验的公式基本覆盖财务管理科目中关于表示企业盈利能力、偿债能力、营运能力等指标内容。

校验耗时短

财债通产品校验单份债券募集说明书平均耗时8-15分钟,校验单份招股说明书平均耗时25-30分钟。

icon不止是校验-更多可挖掘服务畅想icon
更高级比对场景挖掘
报告内容与公司内数据库信息比对
比对内容进一步扩充
更智能的工作流程展现
运用RPA技术,将抽取、校验、比对与RPA技术结合,实现办公流程智能化。
更多高级校验功能挖掘
如审核材料扩展,如ABS报告等,更高级审核,如财务数据异常识别、财务造假风险分析等。
更多抽取场景展现
电子化底稿关键信息提取,如银行对帐单、借款合同、销售采购合同、诉讼文书提取。
icon财债通产品系统技术架构icon
icon克服超长信息字段抽取问题icon
难点叙述
某些字段的长短幅度变大差异巨大,有时只有短短几个字,有时会用很多句话,甚至很多段去描述,如图中所示进行某些假设后对公司合并口径资产负债结构的影响,单看科目为资产负债表的常规科目,但由于加入限定词汇,只按照资产负债表的常规科目进行校验,则会造成误判。
解决方案
增加了bi-LSTM-CRF模型来提高这个字段的召回。由于bilstm-crf采用的是连续特征(字词向量)输入,对于内部特征的综合能力会强于传统离散特征的机器学习方法。在viterbi解码时采用nbest解码方法,进一步提高召回。在模型输出结果上过滤掉部分不需要校验的内容,再按照模型输出概率排序,取概率最高的结果,准确率就非常理想了。
icon克服无边框表格抽取问题icon
难点叙述
在证券市场文本中经常出现无边框表格,且表格中的数据多为重要信息,需要准确的识别和抽取。PDF中的无边框表格抽取很容易造成匹配错位,导致数字提取错误。无边框表格如果叠加上跨页问题,则雪上加霜,进一步加大了处理难度。
解决方案
达观在处理无边框表格问题上,通过空间定位和上下文关联分析并举的方式。综合采用了计算机视觉+自然语义理解的方式, 有效的解析表格中信息。更多复杂情况:跨页表格采用自适应拼接方式处理,嵌套表格采用分块分解方式处理。
icon克服系统抽取性能和负载能力优化问题icon
难点叙述
在开发过程中,我们观察到了最长的招股说明书的文本有600页,在对文本内容进行整体解析时消耗的运算资源非常大,拖慢了整个系统的运转效率。超大文本对各个底层容器( docker )服务之间进行数据传送也是挑战,存在局部模块崩溃的隐患。
解决方案
针对数据量大的问题,我们在文档解析的时候完全并行处理,加速数十倍,而且不会因为少量超大文件导致整个系统卡住。在系统各个部分都为了大文件传递做了合理优化,对于任何数据量可能会大的地方都禁止http传输。深度学习抽取部分也采用了GPU加速,比CPU计算性能提升一个数量级。系统设置了多个容错备份和负载均衡机制。
icon实现富文本认知计算,支持多类文档与格式icon
icon如何使用财债通产品icon
icon达观服务: 成熟的项目咨询与实施方法论icon
第一阶段 需求咨询与沟通

达观拥有成熟的需求咨询与沟通团队,根据您的需求为您量身定做解决方案,并根据需求提供拆解产品组件与定制化服务。

第二阶段 产品试用与培训

我们欢迎产品试用,并提供详尽的培训方案。在产品试用过程中,我们有专业的解决方案小组与技术顾问,为您及时解决各类问题。

第三阶段 项目实施和后续支持

设计、实施并交付产品,并提供知识转移、售后支持等相关服务。

icon我们的服务优势icon
详尽的技术文档
全面详实的各种接口文档
使用教程等服务
长期开发维护
新需求快速响应
及时排期开发
随时的热线服务
7*24小时热线电话
随时提供技术支持
培训和报告
定期提供培训
和运行数据报告
ISO9001认证
ISO9001品质保证
为数据保驾护航
产品推荐 查看更多>>
    云蝠智能销售线索挖掘系统

    云蝠智能销售线索挖掘系统,用技术手段解决ToB销售过程的痛点,助力销售效率和产能的提升,通过对全网企业信息的挖掘和分析,基于目标用户的实际需求,建立销售模型,帮助销售挖掘意向客户、提升成单效率。

    找线索

    地图获客

    筛选资源

    批量查企业

    金蝶云星空全渠道云

    金蝶云星空全渠道云,渠道信息整合,构建多元渠道网络;业务交易协同,全局化库存掌握;强化资源投放,规范活动与费用控制;优化基层决策,提升业务团队执行能力。多样化渠道订货,全面支撑业务拓展,掌握渠道库存,帮助企业实现O2O订单的及时和高效配送。

    业务交易协同

    全局化库存掌握

    强化资源投放

    优化基层决策

    光云快递助手ERP

    光云快递助手ERP,以多平台多店铺订单管理为核心,集合了打单发货、商品管理、库存管理、采购管理、售后管理等优质功能。作为中国首批电商SaaS服务商,光云科技专注于为企业提供电商运营的全链路解决方案。围绕淘宝、天猫、京东、拼多多、抖音、快手等国内主流电商平台,打造面向大中小型商家的电商SaaS产品体系。

    商品管理

    库存管理

    采购管理

    售后管理