-
电网企业是重要的国有能源企业. 近年来,在电网企业信息化水平提高的同时,积累了大量业务数据[1]. 这些数据中蕴涵着潜在的知识和规则,为企业内部审计分析提供了丰富的源材料. 但是,内部审计涉及到财务、工程、科技项目等多个领域,需要审计的数据信息量庞大、信息格式多样. 传统的人工审计模式已经越来越难以适应信息化发展的需求,容易受到人力客观条件的限制,造成审计结果出现偏差[2]. 采用计算机技术来辅助完成审计工作已经成为趋势,具有良好的应用前景[3].
目前,自然语言处理[4]、分类数据[5]等挖掘技术和机器学习模型已被广泛运用在审计领域. 例如:词频-逆文档频度(Term Frequency-Inverse Document Frequency, TF-IDF)技术能够提取审计文本的关键词,为审计工作提供关注重点[6]. Word2vec技术可以有效地将文本转换成计算机可以识别的向量形式,进而被计算机加以利用[4]. 数据挖掘技术在审计领域的运用,可以推动电网企业的审计业务朝着智能化方向转型,节省人力资源成本.
电网企业内部审计面临着因客观因素或者人为因素造成的审计人员错报或者检查风险,因此风险分析在电网企业内部审计中起着重要作用. 把风险导向审计的理论和方法运用到审计过程中,以识别重点风险为出发点,发掘电网企业运营的潜在风险因素,有助提高企业风险管控能力. 因此,设计用于风险导向内部审计的计算机辅助系统具有较大的现实意义和应用价值.
全文HTML
-
风险导向内部审计系统运用分类[5]、离群检测[1]、文本挖掘[6]、自然语言处理[4]等数据挖掘和机器学习方法实现审计数据智能分类与风险因素分析两大功能,其技术构架如图 2所示. 审计数据分类主要借助机器学习技术,首先将文本数据转化为向量,然后构建和训练文本分类器,完成对审计数据的分类. 风险分析包含两个方面,即工程财务费用风险与企业风险管理关注风险. 通过采用离群检测技术发现工程费用数据中存在的异常费用数据来发现工程费用财务风险,通过TF-IDF技术挖掘企业风险管理理论中的重点风险因素来发现企业风险管理关注风险,二者基于自然语言处理技术建立关联,进行电力企业风险挖掘.
-
在审计领域,对发现问题的描述通常是以短文本形式呈现,这些非结构化的审计数据文本蕴含着丰富的审计信息[5]. 但是审计数据需要经过分类才方便进一步进行风险因素挖掘工作. 采用人工模式分类整理海量的审计数据,结果不一定全面、客观、专业,容易受到审计人员自身能力的限制,而且消耗了大量的人力成本. 本文设计了一种基于机器学习技术的审计数据智能分类方法,如图 3所示. 通过提取审计数据文本数据特征并转换成向量形式,然后输入到支持向量机(Support vector machine, SVM)分类器学习特征向量与文本类别之间的关系,进而实现对审计数据的智能分类,详细过程如下:
1) 提取文本特征向量:采用向量空间模型(vector space model, VSM), 以每个词组为项,词组出现频率作为项的权重,将每个文本转换成向量V=(v1, v2, …, vn), 其中vi表示第i个特征项的权重. 采用信息增益作为特征选择算法,选取与分类相关的特征.
2) 分类器学习:文本特征向量V及其类别标签y输入到分类器进行训练学习,获得文本向量与类别对应的关系.
3) 审计问题分类:待分类问题文本特征向量输入到SVM机器学习分类器,实现对待分类问题的分类.
-
风险导向内部审计模式与企业风险管理具有相同的起点和目标,即以风险识别和评估为起点,以实现组织目的为目标[7], 二者进行关联分析实现对风险的准确挖掘. 如图 4所示,风险导向内部审计模式用来挖掘财务报表中异常费用导致的风险,并且计算分析企业风险管理关注风险项,通过关联分析挖掘审计数据中的重大风险. 过程如下:
1) 异常费用检测:运用离群检测技术[1], 挖掘离群异常费用点;
2) 企业风险管理关注风险项识别:=运用TF-IDF挖掘分析企业风险管理理论关注的风险因素[6];
3) 审计风险挖掘:利用自然语言处理提取文本语义信息[4], 建立异常费用问题描述与企业风险管理理论的关联,挖掘出现费用异常的审计风险.
异常费用风险点挖掘是通过分析财务及经营数据变动规律,对成本、收入、资金流量、交易等过程中可能存在的异常财务及经营数据进行挖掘,找出数据中与一般费用存在明显差异的异常数据. 在海量数据中,离群检测技术可以有效地进行异常值的检测[1], 在企业异常数据审计研究中已经证明该方法的可行性[1]. 风险导向审计体系以电网企业积累的大量历史数据为支撑,建立可靠的离群检测模型,用来识别同类项目费用中明显偏离一般费用水平的异常项目费用. 对于出现异常费用的项目,可以初步判定为存在潜在风险的项目,作为风险因素挖掘的对象.
将异常费用风险点与企业风险管理关注风险项进行关联分析. 企业风险管理关注风险项主要采用TF-IDF统计方法对企业风险管理理论进行文本挖掘. TF-IDF方法用来评估风险因素词汇在文档语料库中的重要程度,可以及时过滤出现频率高但并不重要的词汇. TF-IDF的值会随着词汇在文档中出现的次数的增加而增大,也会随着词汇在语料库中出现次数的增多而减小[6]. 通过TF-IDF统计分析计算后,提取企业风险管理理论关注的风险因素,以此作为存在异常费用的风险项目的风险评判理论依据.
根据审计问题分类,查找含有异常费用的潜在风险项目对应的问题描述文本. 自然语言处理技术可以读取审计问题文本中的异常费用上下文信息[4], 与企业风险管理理论关注的风险因素建立关联,识别出异常费用对应的企业风险管理理论关注的风险因素,建立异常数据变动与舞弊行为的关联关系,自动化判断违规行为.
2.1. 审计数据分类
2.2. 风险分析
-
风险导向内部审计系统所挖掘的审计风险结果需进一步结合专家知识和企业生产、经营、管理、维护等方面的实际情况进行评估,并最终获得用于电网企业决策管理支持的风险因素清单. 风险导向内部审计系统使用者在获得由风险导向内部审计系统挖掘出的风险因素候选清单以后,需会同领域专家,结合电力企业内部现状,从降低电网企业生产、经营、管理等过程可能造成的经济损失与社会危害出发,依据“风险因素威胁性=风险因素标准分×经济损失×社会危害”的风险因素评分体系[10]对风险事项进行量化. 在量化过程中,可能重新涉及围绕风险导向审计模式挖掘风险因素的资料收集与调研工作,根据各风险因素评分,计算每个审计项目总风险值,并且列出项目风险排序表,作为风险导向内部审计的最终评估结果.
电网企业可根据风险因素的威胁性,根据企业当前运营状况,调整企业战略决策,及时规避风险,减少企业损失. 同时,根据风险评估结果,及时发现企业内部不足,为企业调整提供一个明确方向. 从长远发展结果来看,这将有助于转变传统审计中事后发现问题的弊端,及早发现威胁企业发展的风险.
-
电网企业内部审计工作量大、涉及面广,以风险为导向的内部审计模式能够在繁杂的审计工作中识别出重大风险事项,为电网企业的风险管控决策提供支持. 本文以风险识别为出发点,运用数据挖掘技术设计了以风险为导向的内部审计体系. 然而,以风险为导向的内部审计模式还需要根据实际应用场景不断进行完善,在复杂的审计数据和规则中,利用信息技术准确识别出重大风险还有很长的路要走,需要相关科研人员不断创新.