大数据环境下高收入自然人分级分类管理探索

【编辑日期:2018-09-26 】【点击数:】 【来源:】 【关闭
 大数据环境下高收入自然人分级分类管理探索

               成都市地方税务局课题组

               课题组组长:张建

               课题组成员:刘冰曾志英 王义均 李钦 卓越 范然

               执笔人:李钦 卓越 范然

 

【摘要】大数据的浪潮已经席卷诸多领域,如何将大数据运用到高收入自然人分类分级风险管理中,将是税务部门运用新技术突破自然人征管瓶颈的重要课题。本文从目前我国税务机关转变高收入自然人判定方式入手,探讨了利用现有数据开展高收入自然人判定的大数据方法,并提出了构建税收大数据的建议。通过建立AHP模型,利用政府或第三方的大量数据,对自然人纳税人的支出情况进行分析并判定高收入人群;进而结合个人所得税申报明细,对自然人纳税人实施分类管理,尤其是加强涉税高风险纳税人的管理。

【关键词大数据 高收入自然人 分类分级 层次分析法

前言

研究背景:在新经济形势下,通过借助对海量、多样化、低价值密度、真实、高增长率数据集合的收集、管理、分析运用,帮助人们在思维模式上实现从传统因果关系向新型关联关系的转变,将极大地提升了数据运用的决策力。税务部门更需紧跟时代潮流,在面临高收入自然人其收入来源渠道多、形式多、隐蔽性和流动性强等诸多征管困难面前,借助大数据实现对高收入自然人纳税人的精准抓取,用数据决策、管理、创新,实现数据控税、管税、强税,使大数据成为提升税收征管质效的重要利器。

研究目的:本文围绕支出建立高收入自然人的判别指标,运用层次分析法(Analytic Hierarchy Process,简称AHP),建立评价模型进行判定,并通过数学方法进行模型验证,为利用大数据判定高收入自然人提出新思路、新方法,更为税务部门信息管税提供可行性技术工具和实践性创新思考。

研究时间:本文主要采取设立模型并通过数学方法验证模型,无特定时间。

 研究方法:主要使用文献分析法、对比分析法、层次分析法等。

 

一、转变高收入自然人判定方式,实现自然人纳税人分类管理

2015年《深化国税、地税征管体制改革方案》(以下简称方案)的通过及公布,标志着我国的税收工作全面进入对纳税人实施分类分级管理的新阶段。方案要求对自然人纳税人按收入和资产实行分类管理。在目前的征管实践中,税务机关主要依赖企业代扣代缴以及纳税人自行申报来获取纳税人收入信息。但由于高收入纳税人的收入具有渠道多、形式多、隐蔽性和流动性强等特点,税务机关难以通过常规手段获取其收入信息,也难以保证信息的真实性、准确性。

在社会经济领域全面拥抱大数据的背景下,运用大数据将极大提高税收征管质效。随着方案的全面实施,税务机关需要借助大数据强化对自然人纳税人的管理,用数据决策、管理、创新,实现数据控税、管税、强税,使大数据成为提升税收治理能力的重要抓手,提供对自然人纳税人分类分级高效管理的技术支持。

因此,笔者认为我国税务机关在判定高收入自然人时,应转换对自然人收入信息过分依赖的传统思维,改为利用政府部门或第三方企业、机构等掌握的个人经济特征、存量资产、商务活动、消费支出等信息,通过大数据分析间接实现对高收入纳税人的定位。

目前,税务机关充分利用较容易获取的、整合度较高的、发展度成熟的政府数据,通过“高收入一般会有高支出、高支出一般需要高收入支撑”的关联性,初步定位前10%的高支出自然人作为判定高收入自然人的突破口,实现以识别高支出自然人分类高收入自然人。

二、基于支出利用AHP模型判定高收入自然人的探索

如何利用海量数据判定高收入自然人是一个复杂的过程。首先需要建立指标体系,其次确定指标权重,最后进行具体的评价分析。本段围绕支出建立高收入自然人的判别指标,运用层次分析法(Analytic Hierarchy Process,简称AHP),建立评价模型进行判定,为利用大数据判定高收入自然人提出新思路、新方法。

AHP是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法。其特点是把问题中的各因素划分为相互联系的有序层次,根据对客观现实的主观判断(主要是两两比较)定量描述每一层元素的重要性。利用数学方法计算反映每一层次元素的相对重要性的权值,通过所有层次间的总排序计算所有元素的相对权重并进行排序。

其大致流程如下:


(一)构建层次结构

各因素对评价对象的影响程度是不同的。为从人群中识别出高支出自然人,需要综合考虑年龄、教育程度、持有或近期购买房屋车辆、子女教育支出、境外消费等一级准则;一级准则还可进一步细分,如购买房屋可分解为是否为解决刚需、房屋面积、坐落地等二级准则。

随着准则的细分、获取的准则数量增加,可以扩展到多级准则。考虑目前信息的局限性及文章叙述的简洁性,本文以目标、一级准则、个人情况共构建三层模型。C1C9分别代表年龄、最高学历、现有房产价值、现有房产数量、一年内购房价值、持有三年以内车辆价值、一年内购买车辆价值、子女教育支出和一年内境外支出,伴随信息类别的丰富可以延伸到Cn

(二)构造判断矩阵

AHP通过数学方法建立每个自然人在准则层上的排序以及每个准则在目标层上的排序,再通过对排序赋以权重,实现数字化的可比较、可传递,最终实现每个自然人在目标层上的排序。

下面以准则层的为例介绍权重确定的过程:

第一步:用分级标度法两两比较准则的相对重要性,分别以19分标示(数值越高相对重要性越高,例如C2相对于C1的重要性为9,则C1相对于C2的重要性为1/9);

第二步:用几何平均法解矩阵特征值求解权重:即先将矩阵各列数值相乘后开n次方,n为矩阵阶数;再求解各列开方后的数值占总和比例即为该列准则所占权重;

第三步:运用数学方法验证模型一致性:若满足 ,即表示重要性大小可传递,不存在内部矛盾,本例中经计算CR=0.016683<0.1,符合一致性条件。若不满足上述公式,则需要调整第一步中两两比较的重要性数值,直至计算数值满足公式要求。

步骤

 

C1

C2

C3

C4

C5

C6

 

第一步

C1

1

9

6

4

5

2

 

C2

0.111111

1

0.666667

0.444444

0.5

0.333333

 

C3

0.166667

1.5

1

0.5

0.333333

0.5

 

C4

0.25

2.25

2

1

1.25

0.75

 

C5

0.2

2

3

0.8

1

0.6

 

C6

0.5

3

2

1.333333

1.666667

1

 

第二步

按列相乘

0.000463

182.25

48

0.948148

1.736111

0.15

 

对乘积开n次方

0.278136

2.381102

1.906369

0.991165

1.0963

0.728923

7.381995

权重Wi

0.037678

0.322555

0.258246

0.134268

0.14851

0.098743

 

第三步

Awi

0.229199

1.944376

1.610901

0.807925

0.916665

0.600547

 

Awi/Wi

6.083148

6.028039

6.237863

6.017262

6.172412

6.081894

6.103436332

CI

 

 

 

 

 

 

0.020687

CR

 

 

 

 

 

 

0.016683

注:Awi为其所在列对应的矩阵向量与Wi整行的矩阵乘积;6.103436332Awi/Wi的平均数 ;不同阶数矩阵的平均随机一致性指标RI可直接外部查询,例如n=6时,RI=1.24

依此方法,我们同样可以构建每个自然人对各准则的判断矩阵。进而可以得出各个自然人在每一个准则下面的所占的权重。

然后根据某自然人在每项准则下所占的权重乘以该项准则占所在层准则的权重作为某自然人在该项准则下的得分;最后将所有自然人在各项准则下的得分加总,并按高低进行排序,得分较高者即可分类为高支出自然人,即潜在的高收入纳税人。

(三)数据验证与AHP模型的持续改进

通过前两部分,利用AHP模型实现了基于支出对高收入自然人的判定,但该判定依赖假设和主观判断。因此取得的判定结果还需进行反向的数据验证,即挑选判定出的纳税人,结合征管数据等,多渠道地获取该纳税人的实际收入进行验证。对判定结果与实际情况不符,应着重分析偏差、异常数据生成的原因,据此调整、修正AHP模型中的计算逻辑和重要假设。

基于“信息来源越广泛,分析的样本越多,大数据分析的结论越准确”的大数据分析的特征。AHP模型还需要在实践中不断扩展数据来源,增加准则,形成更加丰富的评价维度。对不同维度的数据进行互相稽核和校验,不断提高数据的准确性,使AHP模型在运用中得到持续改进和完善。

(四)基于纳税人分类的征管提升措施

在利用AHP判定高支出人群后,在该范围内有针对性的进行收入分析,最终判定是否为高收入自然人。通过对不同收入层次纳税人的分类管理,对高收入纳税人加强税收宣传和辅导,提升纳税遵从度。结合个人所得税申报明细数据,分析对比各类纳税人的收入水平和申报数据之间的差异度,进而将差异度较大纳税人分级为涉税高风险,转交纳税评估或者税务稽查部门采取进一步措施。

三、AHP模型在落地实施中的保障措施和建议

通过前文AHP模型的构建,得出通过多项关键支出指标判定高收入自然人的方式是完全可行的。在模型落地,进行实践运用层面,长期来看需要做好三方面的工作:数据来源广泛且可采集;数据分析能力强大且有效把控运营成本;制度建设完备且能与时俱进。这不仅仅为实现运用支出大数据判定高收入自然人,更是为实现大数据管税和高效的分类分级风险管理提供重要支撑。

(一)实现国家全部门数据共享,助力数据来源标准化。

AHP模型的建立与运算基于广泛、精准的各类数据,只有将国家政府各部门数据壁垒完全打通,AHP模型才能不断进行反馈和修正,真正意义上高效精准抓取重点人群。

将各种数据共享整合,形成有效大数据,需要调动配合的资源非常巨大,只有在国家层面上进行顶层设计才能实现。在国务院印发的《促进大数据发展行动纲要》(国发〔201550号)文件中提到:国家计划在2018年底前建成国家政府数据统一开放平台,率先在信用、社保、教育、科技、环境、安监、金融、质量、企业登记监管等重要领域实现公共数据资源合理适度向社会开放。涉及领域之广、程度之深,将超出以往任何涉税信息,这将为税收工作提供了崭新的数据平台。

税务部门作为国家治理的重要机构,应充分把握这一历史性机遇,不仅就税收谈数据,更要加入到国家大数据的整体战略当中,实现跨主体、广覆盖、高效率、多协作的大数据发展、应用。此外,还应积极参与到大数据标准体系建设,对数据采集、开放程度、指标口径、分类目录、交换接口、访问接口、数据质量、安全保密等关键共性标准提出税务方向的专业需求,找到适合符合我国国情的具体方式。

(二)建立国家专业部门与鼓励民间参与相结合的方式,实现数据分析精准化。

在对模型引入更多准则时,运算的复杂化陡增,一般的信息处理无法满足实际需求,专业的把控非常重要。故不仅仅是针对高收入自然人的分析,对海量涉税数据的统筹把控更需专业化处理。

美国国税部门有核心的专业部门进行信息处理分析,这对于其抓取关键线索,提升办事效率起到事半功倍的效果。故在我国国家主导的大数据战略下,税务部门应当高度重视专业化数据处理部门的建立:在国家税务总局设立统领全国的“数据中心”,负责数据的连接、集中、运算、分析和发布等工作;在省以下可沿用现有风险控制部门、纳税服务部门,对总局推送的风险疑点、风险预测、服务需求趋势等予以应对,并逐级反馈应对结果,供“数据中心”改进工作,形成大流程闭环,使大数据服务税收持续进步。

由于涉税大数据的计算处理是一项极其庞大、长期、复杂的系统性工作,单纯由政府或者税务部门自身的专业人员无法消受,而且耗费巨大物力财力。在商业领域中,某些公司数据搜集和处理专业经验非常丰富,可以鼓励民间技术公司参与,将大部分非关键信息数据通过政府采购、PPP等多种方式与优质公司进行合作,借鉴其优秀的商业经验。

 

(三)制定并完善全流程制度建设,保障数据运用与结果应对规范化。

AHP模型的建立与结果导出,是不能百分百判定准确高收入自然人的,只能缩小其搜索范围。分析结果的论证需要政府其他部门或者商业公司进行精准反馈,比如像美国国家税务局可以要求某些商业公司提供特定个人的商业信息。在国内如何保证第三方的高度配合,尤其是商业公司对政府部门所需数据的支持,制度建设尤为重要。但是现阶段全流程的环节中仅有数据共享阶段的制度建设刚刚起步,而在后续各项工作中,制度建设仍是空白,所以此项工作任重而道远。

长远来看,不仅仅是为自然人纳税人分类分级管理,更是充分利用涉税大数据做好征管体制改革后的多项艰巨工作,大量模型的运算与实际征管的风险管理工作需要搭上一座桥梁,把分析成果转化为征管成效,让各个环节的工作都有规范保障,都将离不开完备的制度建设。所以制定和完善全流程的制度规范,迫在眉睫而且影响深远。

 

参考文献:

[1]靖靖.《高收入者个人所得税征管研究——以XX区局为例》[D].华中师范大学.2013.4

[2]王星林,王立甲.从信息非对称理论看高收入者个人所得税的征管[J].《产业与科技论坛》2010年第9卷第4

[3]张艳娥.《高收入阶层个人所得税征管研究——以河北省遵化市为例》[D].河北大学.2015.5

[4]刘植荣.漫议美国个人所得税[J].《涉外税务》2011年第8

[5]时学成,张彤玉.税收对美国高收入阶层的影响与启示[J].《经济与管理研究》2010年第7

[6] 赵海建.美国税收主要来源于高收入阶层[J].《共产党员》2009年第5

[7]曾德智.《我国商业银行信用卡客户关系管理模式研究》[D].重庆大学.2003.3

[8]陈逸伦.《信用卡客户价值评估研究》[D].东华大学.2014.10

[9]李蓓.《模糊AHP在管理信息系统中的应用研究》[D].中国地质大学.2014.11

[10]郭金玉,张忠彬,孙庆云.层次分析法的研究与应用[J].《中国安全科学学报》20085月第18卷第5

[11]张吉军.模糊层次分析法(FAHP[J].《模糊系统与数学》20006月第14卷第2

[12]孙开,沈昱池.大数据——构建现代税收征管体系的推进器[J].《税务研究》20151月总第359

[13]林颖,徐志明,薛云云.大数据背景下的纳税服务创新[J].《税务研究》201512月总第370

[14]黎锋,李少飞,石秋燕等.大数据背景下的税收风险管理研究[J].《特区经济》201512

[15]何家凤,何少武.大数据时代的纳税评估信息采集模式[J].《财经理论与实践》20155月第36卷第195

[16]王越.大数据时代的税源管理研究[J].《现代商业》20155月第36卷第195

[17]孙懿.大数据时代对税务工作的挑战与对策[J].《学术交流》20156月总第255期第6

[18]肖胜球.大数据时代税务数据应用与发展趋势思考[J].《信息与电脑》2016年第11

 

[打印]      [关闭]