永利注册送29元

數據分析助推經濟責任審計提升效率

发布时间:2018-02-28 14:58:12
來源:廣州審計通訊
浏覽次數:
字體大小

鄒彩輝

  

編者按

經濟責任審計是對領導幹部權力運用進行監督的重要方式,在實施經濟責任審計的過程中必須圍繞領導人員的經濟決策和權力運行軌迹,有針對性地確定審計內容和重點,這就要求審計人員對被審計單位的會議紀要、收發文、領導簽批等文件資料進行審閱分析,從而判斷篩選審計內容和重點。而這些文件的數目可謂是大量甚至是海量,如何明確目標減少文件閱讀量縮小範圍提高審計效率成爲亟待解決的問題。

在對W同志任F集團有限公司(以下簡稱“F集團”)董事長、黨委書記期間進行經濟責任審計的過程中,審計人員根據行業特點、領導人員履行經濟責任情況,結合廣州中贏財富信息科技有限公司的文檔分析工具,對被審單位的收發文、工作呈批等進行歸類搜索及快速預覽,從海量文檔中初步篩選出有效數據進行審閱分析,從而達到縮小範圍、提高審計效率的目標。

 

一、項目具體實施過程

(一)數據采集

1.系統介紹:F集團使用京華網絡有限公司的《京華ExOA協同系統》,系統爲B/SJ2EE架構,服務器爲Linux系統,客戶端爲Windows系統,數據庫爲Oracle。系統在發展集團內40個單位使用,用戶數量超過5200個。系統有公文操作、公文辦理、表單智能、Word正文、任務管理、信息發布、綜合管理等功能,設置了發文、收文、工作事項呈批、用車申請等板塊,涵蓋集團日常管理工作的方方面面。

2.采集需求:根據前期了解分析,審計人員確定發展集團OA系統中發文、收文、工作事項呈批板塊的文檔是審計需要的。但按照《京華ExOA協同系統》的設計,OA系統內全集團所有公司文檔備份是統一存放,無法按公司或文檔板塊采集所需文檔,據此審計人員要求發展集團提供W同志任期內所有文檔備份。

3.采集數據量:采集文檔201GB343077

(二)數據整理

采集的文檔涵蓋了發展集團內40個公司的所有板塊,文檔以“文檔代碼+日期/流水號”、“文檔代碼+流水號+日期+流水號”等多种方式命名(如:attach_971106_201210291311251),文檔格式包括DOCEXCELPPTPDFZIPRAR等。因此,審計人員必須對所需文檔進行重命名,以便後期的使用分析。

1.文檔信息獲取:在對OA系統進行分析後,從後台數據庫中查詢並導出整理文檔所需要的相關信息,如文檔名、文檔格式、文檔標題、所屬事項、所屬板塊、創建時間等。

    得出結果如下:

FILE_NAME

CONTENT_TYPE

TITLE

NAME

FORMSET_NAME

CREATE_TIME

draft_1116395

doc

《關于組團出訪日本、韓國的批複》預覽文件

關于組團出訪日本、韓國的批複

F集團發文

02-7 -14 02.25.05.320000 下午

attach_1113412_20141031095358100

docx

A集團關于加強B國際機場燃氣供應保障工作的複函

ZG管理委員會關于加強B國際機場燃氣供應保障工作的函

F集團收文

19-6 -14 05.11.26.722000 下午

……

 

 

 

 

 

 

2.文檔名稱轉換:

1)在數據庫中建表。

2)將文檔名清單寫入數據庫。

3)使用文件名轉換工具,對發展集團的文檔名稱進行轉換。轉換操作如下:

 

image003

步驟一:點擊“轉換路徑”按鈕,選擇未轉換名稱的文件目錄(選擇文件夾);

步驟二:點擊“輸出路徑”按鈕,選擇需要存放已轉換名稱的文件目錄(選擇文件夾);

步驟三:點擊“轉換文件”按鈕後,自動完成文件名稱轉換。轉換後的文件以“分類_事項_文件名.擴展名”方式命名。

3.轉換後數據量:23.8G, 文檔45981份。

(三)數據分析

1.分析工具介绍:文件分析工具主要是为了实现在海量文件中,快速并精确的找出用户所需要的文件而设计,可对文件名或文件内容通过设置关键字进行搜索。其特点一是速度快,二是支持多种可编辑文檔格式,三是支持复杂条件组合。

(1)分析工具初始化設置

布爾表達式匹配設置

在工具中,可對布爾表達式設置爲“逐行”或“逐個文件”:“逐行”是指同一組條件只在同一段文字中全部爲true才算true;“逐个文件”是指同一组条件在整个文檔中全部为true即爲true

壓縮文件設置

因不能排除部分文檔是已压缩文件形式存在,因此勾选所有压缩文件类型,以便工具在分析时可对压缩文件里面的文檔进行分析。

(2)分析工具操作說明

image009

搜索條件

文件名稱:對文件的名稱進行搜索,當符合條件時在2中显示相关文檔,一般选用“布尔表达式”或“正则表达式”;

包含文本:對文件的內容進行搜索,當符合條件時在2中显示相关文檔一般选用“布尔表达式”或“正则表达式”;

查找位置:要搜索的文件位置,可以是非底層文件夾一般選用“DOS表達式”。

注:文件数量相同时,文件名称搜索速度比文件内容搜索速度快很多,因此文檔名稱轉換的好坏关系到搜索效率。

結果文件

符合上述搜索條件的文件会在此显示。

单击文檔:可在右侧查看摘要或预览等;

双击文檔:可打开文檔;

右鍵:可複制、剪切、重命名等操作。

快速預覽或統計

摘要:可查看本次搜索的摘要;

匹配:可查看符合搜索關鍵字的段落預覽,並高亮關鍵字,僅對內容搜索有效;

文本:可預覽全文,並高亮關鍵字;

缩略图:用缩略图形式展现文檔;

報告:可對本次搜索進行統計。

2.文檔分析步骤

步驟一:按文件類別分類

[思路]按收文、发文、呈批的类别对文檔进行分类,以便观察分析不同类别的文檔特点。

[主要操作] 文檔名称搜索:收文

[結果]将已重命名的文檔分成收文、发文、呈批三类。收文的文檔大部分为不可编辑的图片型PDF等格式文檔,而发文、工作呈批等则主要为DOC等可编辑格式文檔。

步驟二:對各類文件去附件。

[思路]据分析,无论是收文、发文还是呈批事項均可能形成正文及附件多份文檔,审计人员通过审阅正文基本可以获知某事項的主要信息,为迅速快捷获取信息需要对各类别的文件去附件。各类文件夹中,发文类、呈批类中的每一个事項均会形成一份“XXX预览文件”的文檔作为正文记录,數據分析人类提取预览文件即可达到去附件的目的;收文类的事項正文没有统一的规律,主要通过文檔格式及文檔名去除部分附件。

[主要操作]文檔名称搜索:预览文件  --發文及呈批類

文檔名称搜索:(pdf OR doc OR docx) NOT 附件 ——收文类

[結果]提取出所有发文、呈批事項的正文;收文的正文及部分附件。

步驟三:将步驟二中提取的预览文件分为单一事項类及非单一事項类。

[思路]收文的文檔大部分为不可编辑的图片型PDF等格式文檔,仅能对文檔名称进行分析;而发文、工作呈批等则主要为DOC等可编辑格式文檔,可以对文檔名称及文檔内容进行分析。在发文、工作呈批档中请示、批复类文檔一般仅涉及一个或一类事項,只需对其标题进行分析即可快速归类;而会议紀要等文檔则可能涉及多个不同方面的事項,需对其文檔内容进行分析。

[主要操作一] 文檔名称搜索:NOT 紀要 NOT 決議 NOT 工作計劃 NOT 工作總結 NOT 工作報告 NOT 工作重點

[結果一]提取发文类及呈批类所有单一事項文檔

[主要操作二] 文檔名称搜索:紀要 OR 決議 OR 工作計劃 OR 工作總結 OR 工作報告 OR 工作重點

[結果二]提取发文类及呈批类非单一事項文檔

步驟四:分别对發文及呈批類的单一事項文檔、非单一事項文檔以及收文类文檔进行分析归类

[思路]根據F集团的特点并结合以前的审计結果,审计组确定需要关注的事項类别,根據该类事項可能出现的关键字对文檔搜索归类以供后期的审阅分析。审计组确定以下十二类事項:股權類、土地類、資産處置類、招標類、資産核銷類、資本金類、融資擔保類、收購類、薪酬清算類、項目變更類、項目立項類、行政處罰類。

对收文及呈批类单一事項文檔进行分析

[主要操作]文檔名称搜索:股权 AND (轉讓 OR 劃轉 OR 劃出 OR 劃入 OR 收購 OR 購入 OR 出售 OR 受讓 OR 報價 OR 處置 OR 變更 OR 出質 OR 質押 OR 抵押 OR 競價 OR 持有)

[結果]提取单一事項文檔中属于股權類事項文檔

对收文及呈批类非单一事項文檔进行分析。

[主要操作]文檔内容搜索:股权(轉讓|劃轉|劃出|劃入|收購|購入|出售|受讓|報價|處置|變更|出質|質押|抵押|競價)          --注:此處使用正則表達式

[結果]提取非单一事項文檔中属于股權類事項文檔

不可編輯類文件分析:

[主要操作]標題搜索:股權 AND (轉讓 OR 劃轉 OR 劃出 OR 劃入 OR 收購 OR 購入 OR 出售 OR 受讓 OR 報價 OR 處置 OR 變更 OR 出質 OR 質押 OR 抵押 OR 競價 OR 調整)  NOT (辦法 OR  規定 OR  制度  OR 草稿) NOT (OR _1 OR _2 OR _3 OR _4 OR _5 OR _6 OR _7 OR _8 OR _9)

[結果]提取收文中属于股權類事項文檔

3.分析結果

序號

事項

对单一事項的文件

非单一事項

收文

合計

1

股權類

33

24

37

94

2

土地類

14

2

16

32

3

资产處置类

50

12

84

146

4

招標類

400

35

371

806

 

直接委托

 

 

 

57

 

询价(密封報價)

 

 

 

88

 

邀標

 

 

 

108

 

競爭性談判

 

 

 

139

 

……

 

 

 

 

5

核銷類

8

2

11

21

6

資本金類

27

14

31

72

7

融資擔保類

75

33

112

220

8

收購类

5

15

6

26

9

薪酬

2

0

3

5

10

项目變更

60

3

75

138

11

項目立項

101

13

142

256

12

處罰處分

13

 

27

40

 

 

788

153

915

1856

 

 

 

 

 

 

 

二、項目成果

審計人員審閱了經過初步篩選出來的12類共1800多份收發文、工作呈批及相關會議記錄,通過分析、判斷,篩選出76项事項,審計組結合相關資料對其中26个事項跟进审查,发现多个问题:

如在某次会议紀要中,决定同意承接A公司持有的B公司22%股權。經過調查發現,B公司主要負責某項目的建設工作,G集團在該項目未獲正式核准的情況下委托B公司启动了该项目的建设工作,并在该项目被“十三五”规划的征求意见稿中撤掉后,仍签订了股权轉讓协议。201X9月,該項目被國家能源局取消,爲該項目已簽訂合同額達20.52億元,已支付合同款3.69亿元,潜在损失尚无法估计。此决策实际上是承接了轉讓方A公司應承擔的投資損失。

又如C公司位于某地的土地使用權被政府收回事宜。審計組發現,C公司負責的D公司利用某工程項目未在國有建設用地使用權出讓合同約定的日期前開工,致使C公司多次收到國土部門發出的閑置土地調查通知書、閑置土地認定書及聽證告書並上報E集團,E集團未向F集團彙報土地存在被回收的風險。由于未能及時傳遞重要信息,致使未能對風險進行有效控制,購買的16 645平方米土地被國土資源和房屋管理局在2015年無償收回,造成資産損失627.38萬元。

此外,還發現F集团及属下企业多个工程建设项目应公开招标未公开招标、部分工程變更金额或變更比例较大、因建设施工、污染物排放、税款缴交方面政策执行不力被相关部门罚款等问题。

三、經驗總結

在經濟責任審計中對非結構化數據進行分析,一定程度上可实现对被审计单位收发文、呈批等文檔的快速分类及快速预览,从海量文檔中初步筛选出可能需要关注的事項文檔供审计人员审阅分析,从而达到缩小范围提高审计效率的目标。但目前还存在一些不足之处:一是还不能对图片式PDF等不可编辑文檔的内容进行分析;二是不能从文檔中识别和提取数字,从而也不能通过事項涉及金额进行判断分析。