导读:本文包含了连续值论文开题报告文献综述及选题提纲参考文献,主要关键词:连续值,分布式数据,属性约简,邻域粗糙集
连续值论文文献综述
胡军,王凯[1](2017)在《基于邻域粗糙集的连续值分布式数据属性约简》一文中研究指出为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简。给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性。以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法。为了验证该算法的有效性,在7份数据集上进行了3组实验。实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试。实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大,甚至更高。(本文来源于《重庆邮电大学学报(自然科学版)》期刊2017年06期)
唐寅,闵凉宇[2](2016)在《连续值属性约简算法改进》一文中研究指出目前存在的基于粗糙集理论的属性约简算法多数只适用于离散型数据。而在现实工作中,不仅有符号、类别等离散型数据,更有大量的连续型或实型数据,甚至二者的混合。传统的离散化过程并不能保存属性在数值上的差异,造成了一定程度的信息损失。本文提出一种将模糊聚类和粗糙集相结合的属性约简算法,从而避免了实型数据的离散化。(本文来源于《时代金融》期刊2016年24期)
陈晨[3](2016)在《基于模糊聚类和粗糙集的连续值属性约简研究》一文中研究指出属性约简是粗糙集理论的研究热点之一,它是一种保证属性分类能力不变的前提下,剔除冗余属性的过程。通过属性约简,可以实现数据表的列压缩,从而降低数据挖掘的数据量,提升挖掘效率。目前基于粗糙集的属性约简算法多数只适用于离散型数据。然而,在现实工作中,不仅有符号、类别等离散型数据,更有大量的连续型数据,甚至二者的混合。因此,在粗糙集属性约简算法的应用中,通常先对连续数据进行离散化处理。然而,离散化处理过程难以保存属性在数值上的差异,难免造成一定程度的信息损失。因此本文深入研究以往文献,提出了一种基于模糊聚类和粗糙集的连续值属性约简算法。基于模糊聚类和粗糙集的连续值属性约简算法主要分为两个部分:第一部分,引入模糊聚类,将属性值上的模糊性转化为对象关系的模糊性,并以此得到论域对象的划分,这部分相当于粗糙集属性约简中的等价类划分;第二部分,同样运用模糊聚类,将相似度贴近的属性聚为一类,并从每一类中选择代表性的属性构成约简属性子集,而在属性子集的评价上,结合了粗糙集依赖度的概念。通过模糊聚类和粗糙集结合算法得到的属性约简,综合考虑了属性的相异性与相关性,在保证属性信息覆盖广度的同时,降低了约简过程的信息损失,并在依赖度概念上保持了信息系统的分类能力不变。区别于以往粗糙集的启发式属性约简算法,基于模糊聚类和粗糙集的属性约简不需要计算核属性,也省去了逐层逐个计算属性重要度的过程,因而在算法上有所提升。最后通过7组UCI标准数据集以及3组经济金融数据的仿真实验,表明本文提出的算法有效,并且在进一步的决策树分类中,基于约简属性的预测精度多数情况下高于全部条件属性的预测精度。(本文来源于《首都经济贸易大学》期刊2016-05-30)
彭家寅[4](2015)在《基于连续值逻辑之BCK-代数的不分明蕴涵理想》一文中研究指出在连续值逻辑的语义框架下,我们用连续值逻辑上的一元谓词演算方法引入了不分明BCK-蕴涵理想的概念,研究了几种不分明理想的若干性质及其之间一些关系。(本文来源于《模糊系统与数学》期刊2015年05期)
隋云云[5](2015)在《连续值Lukasiewicz系统中命题的随机真度的研究》一文中研究指出在连续值Lukasiewicz系统L∞中,建立了随机真度的概念,给出了随机真度的推理规则,基于此真度给出了命题之间的随机相似度与伪距离,并建立了随机逻辑度量空间(F(S),d),证明了常见的几种运算在该度量空间中关于伪距离是连续的,为在该逻辑系统中建立近似推理理论奠定了基础。(本文来源于《模糊系统与数学》期刊2015年04期)
吉家锋,裴峥[6](2016)在《基于连续值信息系统的模糊规则抽取》一文中研究指出基于模糊隶属度函数和模糊蕴含算子,对于连续值信息系统和决策信息系统,提出抽取简单语言描述命题和复合语言规则的方法。抽取实验的结果表明,通过设置不同的阈值,该方法可获得不同支持度的直观结果,为获得信息系统的整体分布信息和可能蕴含的规则提供帮助。(本文来源于《济南大学学报(自然科学版)》期刊2016年01期)
于万国,陈日升[7](2014)在《基于连续值属性的加权灵活贝叶斯分类器》一文中研究指出文章提出了一种新的贝叶斯分类算法——加权灵活贝叶斯分类器用以处理连续值属性的分类问题。通过度量条件属性与决策属性的相关度,类条件概率中对应的边缘概率密度被赋予了相应的权重,其中,条件属性与决策属性之间的相关性通过基于互信息的相关度量标准来计算。在10个UCI数据集合上面,我们比较了WFNB与加权朴素贝叶斯和灵活贝叶斯分类器的分类精度,试验结果表明,我们提出的WFNB有效地改进了传统贝叶斯分类器的分类精度。(本文来源于《山西财经大学学报》期刊2014年S1期)
张健,王晋东,余定坤[8](2014)在《基于灰关联分析的连续值属性约减算法》一文中研究指出针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重迭性测度,据此对条件属性进行去重迭化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。(本文来源于《计算机应用》期刊2014年02期)
张逸群[9](2013)在《对决策树连续值找分割点的算法的改进》一文中研究指出分类问题是数据研发领域里研究和使用最广泛的技术之一。近几年经济的飞速发展,分类问题在多行业和领域中被广泛使用,那么,怎样更准确、更有效地分类呢?这是多数研究工作人员的目标。决策树(decision tree)以条理清晰,程序严谨,定量、定性分析相结合,方法通俗易懂,容易掌握,应用性较强等优点,被广泛应用。现在构造决策树的算法比较多,如:ID3算法、C4.5算法、CART等。C4.5算法是在ID3算法的基础上进行改进的,C4.5算法选用信息增益率(Info Gain Ratio)为择取分枝属性的标准,此方法弥补了ID3算法在运用信息增益择取分枝属性时偏向于取值较多的属性的不足之处,但是C4.5算法也有部分缺陷,本文主要在其处理连续属性比较耗时问题上进行深入探讨,本文对其连续的处理过程进行改进来提高C4.5算法的计算效率,大大缩短算法用时。(本文来源于《计算机光盘软件与应用》期刊2013年23期)
范宇婷[10](2013)在《基于粗糙集的连续值属性约简算法研究》一文中研究指出人类进入信息化时代,每天的生活工作中,都会产生大量的数据信息,社会活动急需一种处理工具,可以从大量表面看上去杂乱无章、冗余多同时存在数据噪声干扰的大量数据“堆”中删掉没有价值无用的数据,同时获得有用的可以帮助人类做出分析决策的决策规则。粗糙集在处理这方面的问题具有许多优势,因此受到越来越多人的关注并且得到广泛的应用。经典的粗糙集模型是建立在严格的等价关系基础上的等价类划分,所以处理对象只能是离散型数值的决策表。然而现实生活生产工作中产生的大量数据是连续型数值,需要进一步探讨。本文首先给出了贪心算法和基于信息熵的离散化算法,分析了算法的优缺点,在此基础上,重点分析了基于属性重要度的连续数据离散化算法,给出了一个连续型数据决策表用来验证算法。然后给出了直接在决策表中对数据进行处理,提取决策规则以及属性的相对约简的计算方法。此过程中通过设置系统容许误差以及与模糊集结合,计算系统的最大容差类和区分函数,得出决策规则以及相对约简。最后通过具体决策表验证算法的有效性。同时对数据表中存在数据缺失以及数据遗漏的不完备数据表进行了处理,提出了针对连续型决策表的扩展区分矩阵算法,通过矩阵各元素间的逻辑与或运算,得出相对约简和核属性,并用具体决策表验证算法的有效性。最后通过数据填充算法,将不完备数据表转化为完备数据表,提出了基于树结构的约简算法,处理过程浅显易懂,且结果能够得到决策表的所有属性约简。(本文来源于《内蒙古大学》期刊2013-05-20)
连续值论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前存在的基于粗糙集理论的属性约简算法多数只适用于离散型数据。而在现实工作中,不仅有符号、类别等离散型数据,更有大量的连续型或实型数据,甚至二者的混合。传统的离散化过程并不能保存属性在数值上的差异,造成了一定程度的信息损失。本文提出一种将模糊聚类和粗糙集相结合的属性约简算法,从而避免了实型数据的离散化。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
连续值论文参考文献
[1].胡军,王凯.基于邻域粗糙集的连续值分布式数据属性约简[J].重庆邮电大学学报(自然科学版).2017
[2].唐寅,闵凉宇.连续值属性约简算法改进[J].时代金融.2016
[3].陈晨.基于模糊聚类和粗糙集的连续值属性约简研究[D].首都经济贸易大学.2016
[4].彭家寅.基于连续值逻辑之BCK-代数的不分明蕴涵理想[J].模糊系统与数学.2015
[5].隋云云.连续值Lukasiewicz系统中命题的随机真度的研究[J].模糊系统与数学.2015
[6].吉家锋,裴峥.基于连续值信息系统的模糊规则抽取[J].济南大学学报(自然科学版).2016
[7].于万国,陈日升.基于连续值属性的加权灵活贝叶斯分类器[J].山西财经大学学报.2014
[8].张健,王晋东,余定坤.基于灰关联分析的连续值属性约减算法[J].计算机应用.2014
[9].张逸群.对决策树连续值找分割点的算法的改进[J].计算机光盘软件与应用.2013
[10].范宇婷.基于粗糙集的连续值属性约简算法研究[D].内蒙古大学.2013