基于数据挖掘的企业欠税预测研究

基于数据挖掘的企业欠税预测研究

ID:35065692

大小:2.96 MB

页数:60页

时间:2019-03-17

基于数据挖掘的企业欠税预测研究_第1页
基于数据挖掘的企业欠税预测研究_第2页
基于数据挖掘的企业欠税预测研究_第3页
基于数据挖掘的企业欠税预测研究_第4页
基于数据挖掘的企业欠税预测研究_第5页
资源描述:

《基于数据挖掘的企业欠税预测研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于数据挖掘的企业欠税预测研究重庆大学硕士学位论文(学术学位)学生姓名:时待吾指导教师:钟将教授专业:计算机系统结构学科门类:工学重庆大学计算机学院二O一六年四月StudyontheOutstandingTaxesofEnterpriseBasedonDataminingAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofEngineeringByShiDaiwuSupervisedbyProf.ZhongJi

2、angSpecialty:computersystemstructureCollegeofComputerScienceChongqingUniversity,Chongqing,ChinaApril,2016重庆大学硕士学位论文中文摘要摘要随着数据挖掘技术的广泛应用,通过数据挖掘等方法发现隐藏在大量业务数据背后的知识,将这些知识应用于决策支撑、商品营销等多个场景,可以为政府工作带来很多便利、为企业带来更多营收。利用数据挖掘技术针对税务数据进行企业欠税预测研究可以保障国家税收收入,同时为税务稽查部门带来很多便利。本文以某省地税局提供的税额征收记录

3、以及企业注册信息为基础开展税源欠税研究,首先分析了税务记录的数据特点,如各字段的含义以及字段之间的关联,并据此制定了对应的过滤策略。为研究企业纳税行为与宏观经济及所在地区的关系,本文基于征收记录以及税务部门提供的数据字典建立事实表和维度表,从而建立数据仓库进行多维主题分析。通过多维主题分析发现,企业纳税税额及欠税行为与行业发展、所在地区存在一定的时间关联性,因此本文统计企业的税务数据包括每个企业每月的缴税数据、企业所在行业每月的缴税数据、企业所在区域每月的缴税数据作为判断企业是否欠税的一类决策特征,同时建立基于投资人、法人等关联人的企业网络,统计

4、企业所关联企业每月的缴税情况作为描述企业营收情况的一类特征。为保障国家税收收入,本文根据企业之前一段时间的缴税信息预测下一个月企业是否欠税开展企业欠税的预测研究,采用基于数据挖掘的分类预测思想,通过统计观测时间窗口内的企业缴税信息、企业所在行业以及地域的缴税信息、企业关联企业的缴税信息作为特征,选择分类算法生成分类预测模型,预测下一个月是否会发生欠税行为。本文通过选择不同的实验数据集、属性筛选前后、设置不同的观测时间窗口数以及选择不同的分类算法对本文的分类预测模型的性能进行对比实验。实验结果表明:基于决策树的RandomForest分类算法的性能

5、最优,分类模型的准确率、召回率、F值均可高达90%,企业欠税是可以通过企业之前一段时间的缴税情况以及所在行业、区域的缴税情况进行预测的,本文所提出的特征构建方法具有较强的适应性。关键词:数据仓库,欠税预测,税收,分类预测I重庆大学硕士学位论文英文摘要ABSTRACTWiththepopularityofbigdatatechnology,throughusethedataminingmethodonlargenumberofbusinessdatatodiscoveryknowledgewhichhiddeninthedata,theseknow

6、ledgecanbeusefulfordecisionsupport,productmarketingandotherapplications,itcanbringalotofconveniencetogovernmentworkandenterprises.Usingbigdatatechnologytopredicttheoutstandingtaxcanprotectthenationaltaxrevenueandbringalotofconvenienceforthetaxinspectiondepartment.Thisthesisbe

7、ganoutstandingtaxresearchbasedonthetaxrecordsoflocaltaxationbureauofChongqing,wefirstanalyzedthecharacteristicoftaxdatasuchasthemeaningofeachfieldintaxrecordsandthecorrelationbetweenfields,andformulatedthecorrespondingfilteringstrategyaccordingly.Thenweestablishedthefacttable

8、anddimensiontablebasedonthetaxrecordsandtaxdatadictionary,thenbuiltt

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。