收藏本页 打印 放大 缩小
0

利用重复影像筛查技术挖掘舞弊线索

发布时间:2016-11-17 12:25:30    作者:尹会岩 陈宝 张悦    来源:中国保险报·中保网

随着信息电子化的普及,审计手段也随之升级,从过去纸质档案变成电子化、数字化的信息,如何从这些信息中找到审计线索,成为问题的突破口。本文用案例方式阐述了如何利用重复影像筛查技术挖掘舞弊线索,从一个新的维度来践行风险导向审计,供参考。

□尹会岩 陈宝 张悦

随着IT技术应用的不断深入,公司业务发展既要深耕传统的业务领域,同时也要不断地拓展新市场。IT技术的革新促进内部审计不断提高非现场及现场审计效率,通过多方研究、实践,发现利用影像数字签名来进行重复影像筛查的工具,并以此作为挖掘舞弊线索,探索出数据审计新路径,并遵循监督检查与督促落实整改并重的指导思想,通过与被审计单位管理层的交流及反馈,达成将该技术业务向前端应用,以提高风险管理能力,促进了审计成果的运用,实现了审计增值服务,最终形成审计部门与被审计单位共赢。

案例背景

随着政策性农业保险的推广和发展,业务规模不断扩大,合规性问题也开始显现。个别人员受到利益的驱使,通过虚构标的、编造虚假赔案等违法、违规行为获取利益,严重影响了国家惠农富农政策的落实,因而政策性农业保险成为内部审计监督的重点领域。在大量内部审计检查中发现,赔案影像作为赔付的重要依据,尤其是以保险标的损失照片作为理赔要件的养殖险,重复照片是保险欺诈、舞弊的重要线索,而重复照片的筛查一直是靠人工的肉眼比对,用时长、效率低。以往进行检查时,往往需要采用打印出大量理赔影像,并花费大量时间进行人工比对的方式查找线索。如何利用信息技术手段从影像资料中找到审计线索成为新的突破口,也是提高审计效率的关键。

审计目标

通过重复影像筛查技术挖掘出理赔业务系统中重复使用的影像,发现舞弊、保险欺诈线索,能够提高审计及反欺诈的效率、效果,扩大风险识别途径,形成审计证据链,从而杜绝使用重复影像的方式制作虚假赔案。重复影像筛查技术从内部审计角度提出,不但巩固了企业的“第三道防线”,同时也能将审计成果向业务前端扩展应用,是内部审计进行增值服务的体现。如:在此基础上将重复影像筛查技术应用于业务审核阶段,及时发现理赔、承保等环节损失标的影像、验标影像等重复的问题,从而提高系统风险识别能力,增强合规意识,降低系统风险。

审计过程及方法

在审计检查过程中,赔案影像在赔案处理时是以赔案为单位进行存储和展示的,就单个赔案来审核,往往要件齐全、流程完备,审计人员一直在思考,这种核查方法会不会只见树木不见森林,是否存在以个案角度无法识别的风险呢?如果从另外一个维度,即以整个赔案影像为样本集,筛选出重复影像的方式,能否发现舞弊或反欺诈的线索呢?然而,面对以T(1T =1,024G;1G =1,024M,约千万张照片)为单位的理赔影像数据,从中筛查重复影像的工作量十分巨大,人工筛查耗时多且效果不明显。最初,通过筛选文件大小相同的影像,缩小风险数据的范围及数量,再进行人工筛选,但这种筛选方法错误率较高。通过进一步对影像数据相关算法进行学习和研究,发现影像数据的数字签名具有与指纹相同的唯一性,通过建立影像的数字签名数据库,进而利用数据库运算,迅速筛选出重复影像,直接定位问题数据,再以此为线索深入开展审计检查,最终查明问题。具体过程如下:

(一)非现场阶段

以开展农险合规专项审计为例,在发送审计通知后,立即联系并要求被审计单位提供审计时间段内的相关影像数据资料,进行非现场影像资料筛查。影像资料筛查过程主要是通过预先编写的程序,将影像资料进行遍历,在遍历过程中对每个影像进行散列算法计算,使每个影像产生一个唯一的字符串,即影像的哈希值,以此作为影像的数字签名,该字符串类似于人类的指纹具有唯一性。然后,将影像的数字签名及关联信息存储至数据库相关数据表内,形成影像的数字签名数据库。在数据库中通过SQL语句对数据库进行筛选、查重等操作。最后,在数据库中建立重复影像数据表,并将筛查结果关联承保、理赔、收付费等业务信息,通过上述信息进行风险排查,确定审计线索。具体流程详见图1。

应用基于影像数字签名的重复影像筛查技术,审计人员在分公司影像数据中筛查出大量的养殖险赔案存在损失标的照片重复。经过分析,某批赔案重复影像占比达到30.21%,其中最多的一个影像竟被34个赔案重复使用,审计人员将发现报告给审计组长,结过小组讨论,认为需要进一步挖掘线索,先通过数据分析确定问题范围、涉及金额、赔案的处理及审批人员等。审计人员将上述问题赔案按照归属支公司及出险地点进行分析,发现某两个区县支公司的重复情况相对集中;审计人员又将保单号及赔款金额进行汇总,与保单保费数据进行关联比对分析,发现赔付率基本都为30%,初步判断该县支公司可能通过重复影像制作虚假赔案,来实现协议赔付。

(二)现场检查阶段

通过非现场影像数据筛查及分析后,由于掌握了较为完整的审计证据链条,与被审计单位就检查问题的沟通及确认较为简单。审计人员先与相关人员进行谈话了解,相关人员均表示不存在协议比例赔付、通过重复影像制作虚假赔案的情况,审计人员直接将影像数据筛查分析的结果,即将重复影像拷贝至一个单独的文件夹后,按文件大小进行排序,重复的影像排列在一起展示给被审计单位相关人员,由于影像数据展示的直观性,并且能够一目了然地展示出重复影像数据的重复次数、重复数量等多个维度,反映出问题的严重性。相关人员见到后,感到问题的严重性,承认了为解决养殖险查勘工作量大的问题,在承保时与养殖户进行私下协议,在无重大自然灾害及大规模疫病的情况下,按保费的30%进行比例赔付,由于一般养殖险赔付率在10-20%之间,需要使用重复影像来制作虚假赔案达到协议约定的30%的赔付率。审计组也将该情况向被审计单位管理层进行了反馈,得到管理层高度的重视,问题很快得到了整改。

具体流程详见图2。

(三)后续风险排查阶段

审计成果的运用是审计工作价值的体现,是审计工作的核心。审计人员将影像数据筛查技术成果一方面应用于对发现问题单位的后续整改跟踪,一方面应用于其他被审计单位的农险审计线索排查,跟踪到发现上述问题的被审计单位进行了彻底整改,未发现协议赔付的情况。更重要的是,影像数据筛查技术在影像数据应用越来越广泛的今天,具有很强的扩展性,可以进一步扩大影像数据筛查技术应用的内容和范围。审计人员从政策性农险扩展到车险等险种,从理赔影像筛查扩展到承保、风险控制等环节的影像筛查,从而进一步扩大风险排查的范围,提高审计效率。

如在对某某进行经济责任审计过程中,通过影像数据筛查发现部分车险赔案存在重复影像,审计组调取相关赔案的理赔数据,发现这些赔案均为某查勘定损员在一段时间内所处理,通过以上线索查出该查勘定损员在这段时间通过重复影像制作虚假赔案,涉案金额超过50万元,该案相关人员已被问责;在对某被审计单位开展专项审计中,应用重复影像筛查技术筛查出部分的种植险赔案及承保验标影像存在重复,从而找出被审计单位的管控漏洞。

(四)遇到的问题及解决方案

在影像处理的过程中,存在三个难点,一是影像数据量大,运算速度较慢。一般被审计单位影像数据在1T(千万张照片)以上,通过网络进行传输的速度比较慢,在服务器上遍历一次的运算时间在24-48小时之间,如果被审计单位比较固定,可以通过建立固定的审计影像存储及相关数据库,对更新数据进行优化并定期执行增量计算。二是重复影像筛查技术算法有待进一步提高。影像的数字签名技术虽具备高效率、高准确性的特点,但该算法无法实现对于同一标的换角度拍摄等模糊比对识别,为了提高影像数据的风险识别能力,还将继续深入研究模糊比对算法,如矩阵比对算法、基于神经网络的比对算法等。三是重复影像筛查结果需要进一步筛选。重复的影像有大部分是合理的、被允许的,如情况说明、政府文件、赔付账号等,但也有不合理的,如保险标的损失照片等,可以通过建立合理数据表,运算时剔除相关数据的方法来解决。

审计结果及成效

审计组利用影像数据筛查技术在被审计单位发现或多或少的重复影像的问题,成为审计的重要线索,通过深入调查发现多笔舞弊案例及内控漏洞,均对被审计单位提出风险提示及整改建议,并将该技术及使用方法与被审计单位进行交流,将审计过程中挖掘舞弊线索的工具转化为被审计单位的管理工具,将事后的查错纠弊提前至事前防范,提高被审计单位的风险识别能力。在审计发现问题后,帮助某被审计单位以影像数据筛查工具为基础,进行二次开发,搭建重复影像事前检查系统,在业务系统前端上传影像时,进行影像数据数字签名的提取,并在已建立的数据库系统中对影像的数字签名进行筛查,如果发现重复影像立即进行前台操作提示,后台进行日志记录,并对审核人员报警。为了提高风险识别效率,根据预设好的特征值分别赋予不同的权重,由系统根据阀值自动判定是否要进入调查环节,提高第一道防线的风险识别能力,促进审计成果的应用。

思考及启示

目前,企业数据的不断集中及数据量的爆炸式增长,针对全量数据进行风险数据扫描式的风险导向审计成为发展趋势。重复影像筛查作为非结构化数据的处理技术在电子化档案广泛使用的今天,将成为获取审计线索的重要工具,也是提高审计工作效率的关键。该技术不但能够应用在农业保险合规审计及经营管理,解决“十三五”农险合规发展的课题,也能够从被审计单位整体数据的高度,挖掘出影像数据背后的信息,经过与财务、业务和经营管理等方面的数据进行关联分析,找出共性问题、内在规律及发展趋势,从而挖掘舞弊线索、发现内控风险,最终提高企业各环节的风险识别及管控能力,为企业经营管理目标的达成,为国家农业保险惠农政策的落地保驾护航。

(作者单位:中国人民财产保险股份有限公司沈阳监察稽核中心)