基于数据挖掘技术的纳税信用等级划分

基于数据挖掘技术的纳税信用等级划分

李蓓丽[1]2004年在《基于数据挖掘技术的纳税信用等级划分》文中指出本文主要研究利用数据挖掘技术进行纳税信用等级划分以及信用等级划分系统的开发。文章首先阐述了纳税信用分析研究的必要性、国内外研究现状和研究背景、意义和数据挖掘技术相关方面的知识。然后介绍了信用及信用评价的相关模型。针对纳税信用等级划分,分析和总结出神经网络模型是目前良好的信用评价模型。 本文较系统地阐述了数据挖掘技术中的异常检测和聚类技术。基于多策略研究的思想,提出了基于异常的多策略聚类检测技术。它不但能挖掘出异常数据,且提高了聚类的准确度,为纳税信用等级划分的数据预处理和神经网络的训练提供了保证。本文深入地分析了前馈型神经网络中BP网络训练算法,指出了它收敛速度慢,容易陷入局部极小点等问题,同时提出从两个方向优化BP算法。基于坐标轮换思想,阐述了一种非梯度网络训练算法——单参数动态搜索算法(SPDS),它克服了BP算法收敛慢,误差大等缺点。实验表明SPDS比BP算法具有更快的收敛速度,误差小,更好的泛化和容错能力等优点,更加适合实际应用。 本文最后提出了运用基于单参数动态搜索算法的神经网络模型来划分纳税信用等级。从太平地税分局数据库中抽取出经过预处理的数据作为网络训练的样本,同时生成神经网络分类器。实验结果分析得出相比目前的纳税信用等级划分常用的综合评价百分制方法,本文的方法克服了人工评价不客观,评价结果粗糙等不足之处。同时结合“太平地税分局纳税信用等级划分”的课题实践,设计了一个基于数据挖掘技术的纳税人纳税信用等级划分分析系统原型,为进一步开发提供参考和借鉴。

徐邵兵[2]2007年在《纳税信用等级评定分类方法应用研究》文中认为税收是国家财政收入的主要来源,也是国家调节经济发展的重要手段。税收信用是社会信用体系的重要组成部分,诚信纳税在一定程度上反映了社会信用状况。目前,我国的税收信用体系的建设还处于创立阶段,纳税信用等级评定还处在手工或计算机模拟手工评定阶段。税收信息化的发展为纳税信用评定沉积了大量税收业务数据,如何应用数据挖掘技术对进行知识发现,实现纳税信用等级评定的自动化和智能化,是当前税收信息化工作难点之一。本文针对这一课题,结合数据挖掘的分类技术进行研究,主要工作如下:(1)分析总结了税务系统纳税信用等级评定的目的、内容、标准、激励、监控和现状,提出了利用决策树算法来解决纳税信用等级手工评定问题的思路。(2)讨论了数据准备的目标、任务、技术及方法,并按照数据准备的过程对纳税信用等级评定训练数据进行数据选择、数据预处理和数据转换,形成数据挖掘的准备数据。(3)在应用研究过程中,针对C4.5算法的连续属性离散化步骤对于实际的纳税信用等级评定数据计算效率不高,提出了基于经验值窗口分割技术的连续属性离散化算法,应用结果证明改进算法性能良好,符合税务系统应用实际。(4)将改进的C4.5算法应用到纳税信用等级评定中,实现了对纳税人进行纳税信用等级的自动评定,提高了纳税信用等级评定工作的效率,减少了该项工作的人为干扰因素,使得整个评定工作更显公平、公正。(5)基于上述研究,实现了原型实验系统,从理论和实验上证明了所提出的算法的正确性和有效性。

刘伯华[3]2009年在《聚类分析在纳税信用细分中的应用研究》文中认为随着我国经济的快速发展,税收的快速增长对我国纳税信用管理工作提出了新的要求。税务管理模式正逐步向以纳税人为中心、为经济发展服务、以信息化为基础的国际先进模式转变,纳税信用管理成为这种科学管理模式的重要条件。目前我国税务部门对纳税信用进行细分的方法还是基于经验或基于统计的简单划分方法,无法综合考量纳税人各方面的涉税信息,无法满足税收高速增长的需要。随着数据挖掘技术不断成功应用于金融、通信等行业的信用细分,使得借助数据挖掘技术实现多层次、多维度、有针对性的纳税信用细分变成了可能。在税收管理中纳税信用管理的重要性是显而易见的,本论文选取纳税信用管理中的基础工作——纳税信用细分作为研究课题,设计了一个基于聚类分析技术的纳税信用细分模型。本研究探索了纳税数据的组织、处理和存储,并应用数据挖掘中的聚类技术,实现了准确、有效的纳税信用细分,架起了一座从数据挖掘理论通向税务应用的桥梁:首先,数据的获取和预处理是影响数据挖掘结果优劣的一个极其重要的基础性工作,本研究为此付出了大量的时间和精力,并通过对纳税户纳税属性的分析,建立了一套完整的纳税户细分指标体系,将源数据经过数据清洗、转换等一系列数据预处理过程,并最终加载到为纳税信用细分所建立的数据仓库中,为信用细分聚类结果的合理性、有效性和实用性提供了坚实的基础;其次,通过分析各类纳税户的特征,并结合税收管理实践分析对不同类型纳税户做统一的纳税信用细分的问题,本研究将纳税细分数据仓库分为叁个主题——申报征收、税务登记和发票管理来实施,并设计了每个主题的事实表和维表;然后,因为聚类分析是数据挖掘中的一个重要研究领域,也向来极具挑战性,但存在一系列典型的问题,本研究针对算法需预先给出聚类参数K的值和对初始聚类中心的依赖性比较强的缺点,在对经典的K-Means算法作了全面细致分析的基础上,设计了一个基于有效指数动态调整聚类参数K和最佳密度半径确定聚类中心的K-Means聚类算法;最后,本研究以VC++为工具设计了一个基于K-Means聚类算法的纳税信用细分系统,并将江西地税数据库中的部分赣州市纳税户纳税数据作为实际检验数据加载到系统中,通过比较原始K-Means聚类算法和改进后算法的聚类结果,得出了改进后算法的信用细分聚类结果更加切合税务部门日常管理的实际情况的结论。在本研究所做工作的集础上,税务部门能够以此纳税信用细分结果为依据,针对不同纳税户群制定有区别的管理策略,有利于减少税收成本、促进税赋公平;同时,本研究所做的工作对加快税务信息化的步伐也有很高的实用价值。

康红勋[4]2017年在《大数据时代下的税收信用建设研究》文中进行了进一步梳理近年来,尽管我国的税收信用建设取得了一定成就,但是当前税收信用缺失现象依然十分严重,纳税人偷逃税款、征税人收过头税、用税人预算不透明、税务中介合谋等现象屡见不鲜,亟需建立一个完善的税收信用体系。大数据时代的来临为我国税收信用体系的建设提供了良好的契机,大数据在税收领域的应用将会对税收信用理论研究和实践应用产生深刻的影响,因此研究大数据在税收信用建设方面的作用和影响正当其时。国内外学者对税收信用的研究主要集中在纳税信用方面,很少对征税信用、用税信用和税务中介信用进行全面的研究,尤其是大数据时代下税收信用建设的研究更是少见。本文提出了包含纳税信用、征税信用、用税信用和、税务中介信用四个方面的比较全面的税收信用研究框架和内容,并全面分析和研究大数据对税收信用的影响,以期揭示大数据时代下税收信用建设的特征和规律,为大数据时代下的税收信用建设提供参考,具有较强的理论意义及现实意义。构建比较全面的税收信用体系,建立税收信用的完整框架,并研究大数据对税收信用的影响和规律,也是本文在研究框架以及内容上尝试的创新。通过对大数据以及税收信用相关理论概念进行梳理,第二章得出了本研究的理论基础以及研究方法。税收信用从某种角度上说是纳税人、征税人、用税人和税务中介等具有契约特性的博弈关系,大数据的应用会改变或消除税收博弈双方的信息不对称状态,改变博弈均衡结果,从而对税收信用产生影响。基于此种考虑,本文利用信息经济学及博弈论相关理论的分析方法和逻辑思维全面分析大数据时代下的税收信用建设。第四章对纳税人、征税人、用税人、税务中介的信息特点和优势进行了分析,进而总结分析了他们之间的信息不对称的具体表现,正是这种信息不对称严重制约着我国税收信用的发展。而税收大数据不仅涵盖了海量的涉税信息,大数据技术的应用能够充分挖掘和发挥海量涉税信息的价值,在一定程度上会减弱甚至消除纳税人、征税人、用税人、税务中介之间的税收信息不对称状态。至此,提出了大数据对税收信息不对称乃至税收信用影响的理论依据。为了深入分析大数据对税收信用的影响,本文第五章构建了一系列的模型,并尝试将大数据因素纳入模型中,模型包括:纳税信用博弈模型、征税信用委托-代理模型、用税信用声誉模型、税务中介信用博弈模型等。具体的分析过程如下:首先进行了理论分析以及假设,提出大数据对税收信用影响的理论依据以及提出大数据影响的待检验假设;其次,通过博弈论以及委托-代理理论的基本知识建立模型,并进行分析和求均衡解;最后结合模型的均衡解,得出大数据对税收信用建设的影响。通过一系列分析,本文主要得出以下基本结论:(一)纳税人是否选择诚信纳税与税务机关的稽查成本Ct、税务机关能否稽查出纳税人偷漏税的概率ε有关。大数据的利用会通过降低税务机关的稽查成本,提高税务机关稽查的技术,进而降低纳税人偷税漏税的概率,这将最终有利于提高纳税人的税收信用;(二)通过分析求解信息不对称和信息对称条件下的委托-代理模型,得出在信息对称条件下征税人(税务机关)作为代理人工作努力程度更高,政府部门的最优收益更大,因此大数据的运用有利于征税信用建设;(叁)政府的税收效用与纳税人对政府信用的预期正相关,然而大数据对纳税人的预期、博弈均衡结果以及用税信用的影响是错综复杂的;(四)大数据的应用会降低税务机关的稽查成本,提高税务机关稽查成功的概率,加大税务中介合谋的损失等一系列效果,最终会有利于税务中介的信用建设。通过以上五章的分析,本文进一步明确了大数据对我国税收信用建设的促进作用,科学合理的运用大数据会给我国的税收信用建设带来重大发展机遇。因此,加快构建与大数据时代相适应的税收信用体系是当前税收信用建设工作的重中之重。最后,基于以上研究的结论,结合我国税收信用建设现状,本文提出大数据时代下我国的税收信用体系建设的政策性建议。主要包括两个部分:一是完善大数据下税收信用建设基本要件,以及实行一些具体措施;二是完善纳税人信用等级评定制度、加强征管环节的税收信用、重视税务中介的信用建设等建议。

徐邵兵[5]2009年在《决策树算法在纳税信用等级评定中的应用研究》文中研究表明纳税信用等级评定的实现是需要对大量税收数据进行分析和判定的结果,决策树是进行数据挖掘和分类的常用工具,其中以C4.5算法最为流行。如何应用数据挖掘技术改变纳税信用等级手工评定的现状是当前税务系统税收信息化工作难点之一。文章主要讨论如何应用C4.5算法构造纳税信用等级评定决策树,通过对纳税人涉税数据的采集、预处理、属性选择、决策树生成和剪枝等一系列过程最终生成纳税信用等级评定决策树,并根据生成的决策树实现对纳税人纳税信用等级的判决。

雷显春[6]2007年在《纳税信用等级评定和网上申报系统研究与开发》文中指出我国纳税网上申报系统建设受到纳税人信用度不高和申报体系缺乏有效的控制手段这两个因素的影响,把纳税信用等级评定与网上申报结合起来,改进纳税信用等级评定方法,对网上申报实行分类控制管理可以促进诚信网上申报的实现。本文从地方税务局的纳税申报实际出发,在对申报业务流程和纳税信用等级评定流程进行系统调查的基础上,设计了纳税申报环境下的信用等级评定流程和纳税申报流程,把纳税申报和信用等级评定管理在申报系统中进行有机的结合。本文把模糊聚类分析应用到纳税信用等级评定中,提高了评定效率和客观性。本文设计的纳税申报系统分为六个模块:税务登记、纳税申报、税款缴纳、发票管理、计会统计和纳税信用等级评定。分别对系统的总体构架和各个模块进行设计,实现了基于纳税信用等级评定的网上申报系统。该申报系统根据纳税人不同的纳税级别提供差异化的申报管理,对纳税人的申报进行有效的控制,从申报流程和制度上来提高纳税申报质量,营造诚信申报环境。网上申报系统通过CTAIS接口和银税接口分别与税收征收管理系统、银行业务系统进行数据交互,构成了一个完善的税收申报体系。

李延涛[7]2016年在《基于自适应BP神经网络的纳税信用风险分类研究》文中进行了进一步梳理税收信用是社会信用体系的重要组成部分,诚信纳税在一定程度上反映了社会信用状况。纳税信用风险分类管理,其本质是根据纳税人履行纳税义务的情况,按照纳税人信用风险程度不同进行分类,根据不同的纳税人信用风险情况,进行针对性、差异化的管理。税收信息化的迅速发展为纳税信用风险管理提供了大量的数据支持,如何基于历史涉税数据,利用数据挖掘技术实现对纳税信用风险进行科学有效地识别和分类,是当前税务部门税源管理实践中一个新课题。首先,针对BP神经网络算法应用在纳税信用风险分类过程中,存在收敛速度慢、分类精度不高和泛化能力差缺点,提出了基于BP网络误差函数优化的纳税信用风险分类算法BP-OEF。该算法将复合误差函数融入到传统BP神经网络算法中,引入了隐含层的误差函数概念,利用误差变化率为权重,根据误差变化率自适应对BP神经网络的权值进行调整。在模型训练的后期,凭借较大的误差变化率依然能加快网络的收敛速度和避免陷入局部极小点,为纳税信用风险分类模型的训练提供了保证。其次,在应用BP神经网络算法构建纳税信用风险分类模型时,为解决传统神经网络中固定学习速率选择对风险分类模型训练造成的性能缺陷问题,提出了融入分层自适应机制的BP网络纳税信用风险分类算法BP-LAAM。该算法在基于BP神经网络算法的基础上,分别为隐含层和输出层设置学习率,根据误差大小和误差趋势,自适应调整学习速率,保证学习速率能自适应地保持在一个相对合适的位置,从而加快网络的收敛速度和提高信用风险分类模型分类准确率和稳定性。最后,对以上提出的两种算法进行了实验验证。实验结果表明,与传统BP神经网络算法相比较,基于BP网络误差函数优化的纳税信用风险分类算法BP-OEF和融入分层自适应机制的BP网络纳税信用风险分类算法BP-LAAM,在解决纳税信用风险分类问题时,训练生成的纳税信用风险分类模型收敛速度快、分类精度高和泛化能力强,实验验证了算法的有效性。

王俊[8]2012年在《数据仓库技术在税收分析系统开发中的应用》文中提出当前税务部门存在信息系统繁多,数据零散,集中整合度低,不能适应当前的税收决策和数据分析,不能转化成为企业和地方经济服务的有用知识,只有充分发挥数据的分析和挖掘能力,才能达到服务和支撑作用。在信息技术迅速发展与数据仓库深入应用的今天,税务部门应用数据仓库技术解决税收工作中的分析与决策问题,以处理税收工作效率与工作质量的矛盾成为发展趋势。因此,数据仓库技术在我国税收中的研究有重要的应用价值。本课题就是在这种情况产生的。本论文在熟悉税收业务和现有税务管理信息系统的基础上,首先介绍了课题的研究背景、目的、意义及国内外数据仓库技术应用的现状,然后分析了数据仓库、数据挖掘、OLAP等相关技术探讨在税务系统建设税务数据仓库的方法和步骤,设计了税务数据仓库的数据模型和体系结构,描述了数据抽取、转换、装载过程。研究了数据仓库的逻辑设计和物理设计,建立了税务数据仓库系统。最后对OLAP及数据挖掘技术在税收数据分析中的应用进行了研究。通过应用数据仓库技术,对税务系统的内部和外部数据进行综合分析处理,能够反映纳税规模,指导税收业务,服务纳税申报。本课题中构建的数据仓库系统采用了目前最实用的工具和方法,具有较好的可靠性和适应性,数据仓库构建简便,数据分析工具和数据挖掘工具功能丰富,操作简单,具有很好的应用价值。

张佳瑶[9]2013年在《基于聚类的数据挖掘技术在税源监控中的应用》文中研究表明随着计算机、通信、人工智能等技术的不断发展,社会信息化程度不断加深。商务信息化、医疗信息化、政务信息化……各种信息化充斥于人们的生活中,使我们生活的社会也成为了信息化的社会。信息化深刻地影响着人们的工作、学习和生活,一方面带来的是多种多样的便利,另一方面也产生了海量的数据,“数据膨胀但是知识贫乏”的问题日益突出。而在知识经济时代,知识创造财富,如何掌握最新的知识成为了竞争的焦点。因此,从海量信息背后挖掘隐藏的、以前未知的知识,成为了当今研究与应用的新热点。作为为国聚财、为民收税的税务部门,同样也面临着海量的涉税数据无法深度加工利用,浪费了许多有价值信息的严峻问题。随着“金税叁期”进程的不断推进,税务部门的数据由省级集中进一步上升为全国的数据大集中,税务征管数据库中积累了大量内部与外部的数据。但是当前税务部门的这些数据的处理与分析仅仅局限在查询、汇总、简单对比等较基础的应用,缺乏对数据蕴含的信息的深层次挖掘。本文力求在税务管理工作中引入数据挖掘技术,来提高税务决策的科学性以及纳税服务的质量,并将研究的重点放在了聚类算法在税源监控中的应用上。税源监控作为一种基础性税收管理活动,贯穿于纳税申报、纳税服务与税务稽核等流程中。掌握最全的税源信息,实施严密的监控措施,可以有效保证税收的应收尽收,实现国家宏观政策。聚类算法作为数据挖掘的一种技术,已被人们广泛地应用于医疗、商业、生物等多个领域。将聚类算法应用于税源监控中,可以有效提高税源分类的科学性,并能帮助税务管理人员有针对性地制定不同的税源管理决策,对于税务部门工作效率和管理水平的提高具有重要的现实意义。本文在总结国内外研究与应用经验的基础上,概括总结了数据挖掘技术、聚类算法、K-means聚类分析和税源监控等方面的知识,并将两方面知识结合起来,分析了聚类算法在税源监控中全面应用的必要性与可行性,设计了聚类算法在税源监控应用的模型。然后本文使用SPSS Clementine12.0软件并严格按照CRISP-DM“跨行业数据挖掘的标准化过程”建立模型,按照本文选取的数据指标体系,抽取了大智慧软件相关的财务数据,对166个纳税人进行了聚类的案例分析,将其分为一般税源、重点税源以及优质税源叁大类,并有针对性地对各类税源提出了税务监管建议。最后本文在归纳总结聚类算法在税源管理中应用的基础上,为聚类技术在税源监控中的全面应用提出了相关的建议。

赵明南[10]2006年在《数据挖掘在纳税评估中的应用》文中研究说明随着数据库技术的成熟和数据应用的普及,在税务系统每天所接收和处理大量的数据,人们保存如此大量的数据,一是因为计算机技术的发展使之变得方便可行,二是因为这些数据具有巨大的潜在作用。数据挖掘被认为是解决“数据爆炸”和“数据丰富”以及“知识缺乏”的一种有效方法。利用数据挖掘技术可以帮助税务部门对企业的财务状况有着大体的了解,从而可以对企业的纳税情况进行监控。本文对数据挖掘的基本原理作了阐述,分析了数据挖掘的基本技术基础、步骤及主要分析方法,介绍了数据挖掘工具的算法和特点,阐述了数据瓦解与数据库知识发现、联机分析处理、专家系统等容易混淆的概念,并结合具体实例说明了数据挖掘在纳税评估中的两个重要应用:分类模型的应用及关联模型的应用。通过对纳税评估方法的研究使我们认识到关联模型在纳税评估中起着重要及不可代替的作用,它决定着纳税评估各项指标值的确定及重要程度(税务系统对企业进行纳税评估时各项指标的值及重要程度是对企业纳税情况、经营状况正常与否进行评价的重要因素)。

参考文献:

[1]. 基于数据挖掘技术的纳税信用等级划分[D]. 李蓓丽. 哈尔滨工程大学. 2004

[2]. 纳税信用等级评定分类方法应用研究[D]. 徐邵兵. 合肥工业大学. 2007

[3]. 聚类分析在纳税信用细分中的应用研究[D]. 刘伯华. 江西理工大学. 2009

[4]. 大数据时代下的税收信用建设研究[D]. 康红勋. 中共中央党校. 2017

[5]. 决策树算法在纳税信用等级评定中的应用研究[J]. 徐邵兵. 电脑知识与技术. 2009

[6]. 纳税信用等级评定和网上申报系统研究与开发[D]. 雷显春. 西安理工大学. 2007

[7]. 基于自适应BP神经网络的纳税信用风险分类研究[D]. 李延涛. 燕山大学. 2016

[8]. 数据仓库技术在税收分析系统开发中的应用[D]. 王俊. 南昌大学. 2012

[9]. 基于聚类的数据挖掘技术在税源监控中的应用[D]. 张佳瑶. 财政部财政科学研究所. 2013

[10]. 数据挖掘在纳税评估中的应用[D]. 赵明南. 吉林大学. 2006

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于数据挖掘技术的纳税信用等级划分
下载Doc文档

猜你喜欢