软件缺陷预测论文-张志武

软件缺陷预测论文-张志武

导读:本文包含了软件缺陷预测论文开题报告文献综述及选题提纲参考文献,主要关键词:软件缺陷预测,字典学习,半监督学习,特征选择

软件缺陷预测论文文献综述

张志武[1](2019)在《基于机器学习的软件缺陷预测方法研究》一文中研究指出随着信息技术的不断发展,信息安全面临的挑战日益严峻,其中软件安全引起人们越来越多的重视。作为软件安全风险的主要根源之一,软件缺陷不仅可威胁计算机信息系统的安全性和稳定性,甚至可能被黑客利用而恶意入侵。软件缺陷预测是软件工程领域中与软件质量保证密切相关的重要的研究课题,它对提高软件系统质量和优化测试资源分配都有重要意义。在软件工程数据挖掘领域中,基于机器学习的静态软件缺陷预测根据软件历史仓库数据,采用缺陷相关的度量对软件代码或开发过程进行分析,利用机器学习方法来预测软件项目中待测试程序模块的缺陷倾向性或缺陷数量。影响缺陷预测性能的主要因素有:度量元的设计、缺陷预测模型的构建以及缺陷预测数据集的相关处理。本文从机器学习的角度针对上述影响因素对软件缺陷预测方法进行了系统的研究,主要研究成果总结如下:(一)基于联合表示的软件缺陷数据特征选择与分类提出了基于联合表示值的过滤型软件缺陷数据特征选择方法(CRS)和基于联合表示的软件缺陷预测分类方法(CSDP)。为消除软件缺陷数据集中缺陷度量元间的冗余性和提高特征选择方法的计算效率,CRS利用联合表示和l_2图构建缺陷数据关系图的邻接关系和权重,在考虑联合表示保留能力的同时考虑数据方差,通过联合表示值的大小排序并迭代选择缺陷数据特征。CSDP首先对无缺陷训练数据集进行Laplace Score采样以构建类别平衡的训练数据,接着利用联合表示求得查询样本的投影矩阵,最后利用基于正则化最小二乘的联合表示分类方法构建软件缺陷预测器。CSDP采用_2l范数正则化取代_1l范数正则化,进一步增强稀疏分类的效率、降低计算复杂度;CSDP中的联合表示分类器既利用类特定的表示残差的鉴别能力,又利用l_2模“稀疏项”的鉴别信息,分类性能得到提升。在广泛使用的软件缺陷预测数据集上的实验结果表明了两种方法的有效性。(二)基于字典学习的软件缺陷预测将以预测缺陷倾向性为目标的软件缺陷预测看成是一个二分类问题,在分类预测时引入字典学习技术,针对软件缺陷预测的代价敏感性与类不平衡性特征、缺陷数据的逐步积累增量式学习和半监督场景下的缺陷预测的问题,分别提出了叁个字典学习软件缺陷预测方法,即代价敏感鉴别字典学习(CDDL)、类特定增量字典学习(CIDL)和基于二次学习的半监督字典学习(TLSDL)。CDDL在构造初始字典原子时,通过PCA处理消除了类不平衡问题,利用软件模块间的相似性,设计出有鉴别能力的字典,同时考虑软件缺陷预测的风险成本,在鉴别字典学习缺陷预测模型中引入代价敏感学习。CIDL针对传统字典学习在大数据集上批量学习时计算代价过高的问题,设计了增量式字典学习方法。在初始集上采用类特定字典学习,学得的有监督字典有利于分类预测,在增量集上采用互信息最大原则选取增量字典原子,有利于充分利用增量数据的互补信息。为了解决在有标记样本较少而无标记样本丰富的半监督场景下构建有效的缺陷字典学习模型困难的问题,TLSDL采用二次学习框架,在第一阶段学习中,大量无标记样本通过概率软标记标注扩充到有标记训练样本集中,实现半监督学习的扩展,在第二阶段学习中,通过鉴别字典学习,实现稀疏表示分类和预测性能的提升。实验结果表明了叁种字典学习方法的有效性。(叁)基于图学习的半监督软件缺陷预测为了充分表示软件缺陷数据间潜在的聚类关系,提出了一个具备稀疏性、高鉴别能力和自适应近邻的信息图——非负稀疏图(NSG)的构建方法,NSG在稀疏图的学习过程中加入了非负限制,图上结点的连接关系和权重在非负稀疏编码时同时得到。在NSG上提出了两个基于图学习的半监督缺陷预测方法:基于非负稀疏图的协同训练缺陷预测方法(NSGCT)和基于非负稀疏图的标记扩散缺陷预测方法(NSGLP)。NSGCT方法结合基于图学习的方法和基于分歧的方法的优点,对无标记数据进行显式置信度估计,减少了噪声数据的引入,提高了半监督协同训练算法的性能。NSGLP方法采用拉普拉斯采样技术对数据集进行不平衡处理,利用NSG表示缺陷数据间的关系,在NSG上利用标记扩散半监督学习方法迭代预测无标记模块的类型标记,NSGLP通过不平衡处理和有效构建信息图提升了半监督缺陷预测的性能。实验结果表明了两种基于图的半监督方法的有效性。(本文来源于《南京邮电大学》期刊2019-12-09)

蒋帅[2](2019)在《基于特征选择的软件缺陷预测方法》一文中研究指出软件缺陷对软件功能的实现具有不可预知的危险,是软件产品的固有成分,提高软件的可靠性,关键在于降低软件缺陷出现的概率,而如何利用已有缺陷数据构建预测系统框架是研究的重点.针对传统软件测试技术虽然能够有效发现软件缺陷,但需要消耗大量的时间和精力,制约软件开发效率的缺点,提出基于特征选择的软件缺陷预测方法,算法对软件缺陷模型的经验数据集进行多特征选择,进而克服数据集之间的冗余性移除无关特征,得到缺陷模型的分类,最终实现软件缺陷的精确预测.实验表明,基于特征选择的软件缺陷预测方法具有较好的预测效果和较高的应用价值.(本文来源于《平顶山学院学报》期刊2019年05期)

何金虎,吴翔虎,曲明成[3](2019)在《基于迁移学习的软件缺陷预测算法研究》一文中研究指出软件缺陷预测技术可以用于预测软件缺陷是否存在以及其可能存在的数目,以决定软件是否可以交付,对于软件性能的提升和质量的保证有着重要的意义。迁移学习则可以利用不同软件项目中的数据,进行跨项目的软件缺陷预测工作,以应对传统缺陷预测算法中数据不足的问题。本文首先阐述了缺陷预测和迁移学习的相关理论研究现状及其分类,然后对现有的TrAdaboost算法进行优化,修改了迭代分类器的评估指标,并结合实验证明了其合理性和优越性。(本文来源于《智能计算机与应用》期刊2019年05期)

金秀玲,柯荣泰[4](2019)在《基于Boruta-SVM的软件缺陷预测》一文中研究指出软件缺陷预测可以识别软件缺陷代码,降低软件开发和维护工程中的运行风险和成本。Boruta降维的目标是提取出所有与因变量相关的特征,与以损失函数最小化为目标的传统降维方法比较,具有全局性;添加径向核函数的SVM模型具有结构风险最小化的优点。结合两者特点,提出基于Boruta-SVM的软件缺陷预测模型。本文先采用Boruta降维方法提取NASA MDP数据集中所有与因变量相关的特征;然后根据新的特征,通过10折交叉验证确定径向核函数的参数,最后构建SVM模型。实验结果表明:将Boruta-SVM应用于软件缺陷预测中精可以提高预测模型的性能。(本文来源于《山西大同大学学报(自然科学版)》期刊2019年04期)

张洋[5](2019)在《一种基于Logicboost的软件缺陷预测方法》一文中研究指出针对软件缺陷预测中对不平衡数据分类精度较低的问题,提出了一种新的基于LogitBoost集成分类预测算法,使用SMOTE方法对原始数据集进行平衡处理,然后使用随机森林算法作为弱分类器算法进行分类预测,最后使用LogitBoost算法以加权方式集成各弱分类器的结果。通过在NASAMDP基础数据集上验证得出本文提出的分类预测算法比数据集均衡处理前准确率高出0.1%-11%,同时在均衡处理后比KNN算法平均高出0.9%,比SVM算法平均高出0.4%,比随机森林算法平均高出0.1%。(本文来源于《软件》期刊2019年08期)

郑尚,孙丹,于化龙[6](2019)在《基于模糊加权极限学习机的类不平衡软件缺陷预测》一文中研究指出在软件缺陷预测中,普遍存在软件缺陷数据的类不平衡问题,严重影响着传统预测模型的性能.为了缓解类不平衡对预测模型性能的影响,引入模糊集的思想,提出了一种基于相对密度的模糊加权极限学习机算法.该方法首先采用所提的相对密度方法求出适用于不同数据样本的加权矩阵,进而将其与传统加权极限学习机结合,并训练模糊极限学习机,最后通过NASA软件缺陷类不平衡数据对所提方法的有效性和可行性进行验证.实验结果表明:与诸多类不平衡软件缺陷预测方法相比,文中方法具有更好的预测性能,并在G-mean、AUC和Balance的评价指标上有较优表现.(本文来源于《江苏科技大学学报(自然科学版)》期刊2019年04期)

邱少健,蔡子仪,陆璐[7](2019)在《基于卷积神经网络的代价敏感软件缺陷预测模型》一文中研究指出基于机器学习的软件缺陷预测方法受到软件工程领域学者们的普遍关注,通过缺陷预测模型可一定程度地分析软件中的缺陷分布,以此帮助软件质量保障团队发现软件中潜在的错误并合理分配测试资源。然而,现有多数的缺陷预测方法是基于代码行数、模块依赖程度、栈引用深度等人工提取的软件特征进行缺陷预测的。此类方法未考虑到软件源码中潜在的语义特征,可能导致预测效果不理想。为了解决以上问题,文中利用卷积神经网络挖掘源码中隐含的语义特征,并将其用于软件缺陷预测的任务中。在源码语义特征的有效挖掘方面,采用叁层卷积神经网络提取数据抽象特征。在数据不平衡处理方面,采用代价敏感的方法,即分别给予正例与反例不同的权重,平衡正反例对模型训练的影响。在实验数据集方面,选取了开源缺陷标注数据集PROMISE中8个软件中的多个版本,合计19个项目。在模型性能比较方面,将提出的基于卷积神经网络的代价敏感软件缺陷预测模型(Cost-Sensitive Three-Layer Convolutional Neural Network,CS-TCNN)分别与逻辑回归、深度置信网络等模型进行比较,评估指标为在缺陷预测研究领域中普遍使用的AUC和MCC。实验结果充分说明了CS-TCNN能更有效地提取程序代码中的语义特征,进而提高软件缺陷预测模型的预测效果。(本文来源于《计算机科学》期刊2019年11期)

胡梦园,黄鸿云,丁佐华[8](2019)在《用于软件缺陷预测的集成模型》一文中研究指出软件缺陷预测的目的是有效地识别出有缺陷的模块。对于类别平衡数据,传统的分类器具有较好的预测效果,但当数据类别比例分布不均衡时,传统的分类器往往偏向于多数类,易使得少数类模块被误分。但是,真实的软件缺陷预测中的数据往往是类别不平衡的。为了处理软件缺陷中的这种类别不平衡问题,文中提出了基于改进的类权自适应、软投票与阈值移动的集成模型,该模型在不改变原始数据集的情况下,从训练阶段和决策阶段同时考虑处理类别不平衡的问题。首先,在类权值学习阶段,通过类权自适应学习得到不同类的最优权值;然后,在训练阶段,使用前一步得到的最优权值训练3个基分类器,并通过软集成的方法组合3个基分类器;最后,在决策阶段,根据阈值移动模型来做出决策,以得到最终预测类别。为了证明所提方法的有效性,实验采用NASA软件缺陷标准数据集和Eclipse软件缺陷标准数据集进行预测,并在相同的数据集上将其与近年提出的几种软件缺陷预测方法在召回率值Pd、假正例率值Pf和F1度量值F-measure方面进行了对比。实验结果表明,所提方法的召回率Pd平均提高了0.09,在F1度量值F-measure上平均提高了0.06。因此,文中提出的处理软件缺陷预测中类别不平衡问题的方法的整体性能优于其他软件缺陷预测方法,具有较好的预测效果。(本文来源于《计算机科学》期刊2019年11期)

宫丽娜,姜淑娟,姜丽[9](2019)在《软件缺陷预测技术研究进展》一文中研究指出随着软件规模的扩大和复杂度的不断提高,软件的质量问题成为关注的焦点,软件缺陷是软件质量的对立面,威胁着软件质量,如何在软件开发的早期挖掘出缺陷模块成为一个亟需解决的问题.软件缺陷预测通过挖掘软件历史仓库,设计出与缺陷相关的内在度量元,然后借助机器学习等方法来提前发现与锁定缺陷模块,从而合理地分配有限的资源.因此,软件缺陷预测是软件质量保证的重要途径之一,近年来已成为软件工程中一个非常重要的研究课题.汇总近8年(2010年~2017年)国内外的缺陷预测技术的研究成果,并以缺陷预测的形式为主线进行分析,首先介绍了软件缺陷预测模型的框架;然后从软件缺陷数据集、构建模型的方法及评价指标这3个方面对已有的研究工作进行分类归纳和比较;最后探讨了软件缺陷预测的未来可能的研究方向、机遇和挑战.(本文来源于《软件学报》期刊2019年10期)

莫有印[10](2019)在《应用于软件缺陷预测模型的量子粒子群优化BP算法》一文中研究指出软件缺陷检测的主要目的是对程序模块中是否存在缺陷进行自动检测,以此有效促进软件的测试进程,使软件系统质量得到提高。针对传统软件缺陷预测模型的问题,提出在软件缺陷预测模型中使用粒子群优化BP算法。此模型使用粒子群优化算法对BP神经网络权值及阈值进行优化,通过交叉验证方法实现实验,并且同传统机器学习方法及BP神经网络等方法进行对比,实验结果表明提出的方法预测精准性比较高。(本文来源于《现代电子技术》期刊2019年15期)

软件缺陷预测论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

软件缺陷对软件功能的实现具有不可预知的危险,是软件产品的固有成分,提高软件的可靠性,关键在于降低软件缺陷出现的概率,而如何利用已有缺陷数据构建预测系统框架是研究的重点.针对传统软件测试技术虽然能够有效发现软件缺陷,但需要消耗大量的时间和精力,制约软件开发效率的缺点,提出基于特征选择的软件缺陷预测方法,算法对软件缺陷模型的经验数据集进行多特征选择,进而克服数据集之间的冗余性移除无关特征,得到缺陷模型的分类,最终实现软件缺陷的精确预测.实验表明,基于特征选择的软件缺陷预测方法具有较好的预测效果和较高的应用价值.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

软件缺陷预测论文参考文献

[1].张志武.基于机器学习的软件缺陷预测方法研究[D].南京邮电大学.2019

[2].蒋帅.基于特征选择的软件缺陷预测方法[J].平顶山学院学报.2019

[3].何金虎,吴翔虎,曲明成.基于迁移学习的软件缺陷预测算法研究[J].智能计算机与应用.2019

[4].金秀玲,柯荣泰.基于Boruta-SVM的软件缺陷预测[J].山西大同大学学报(自然科学版).2019

[5].张洋.一种基于Logicboost的软件缺陷预测方法[J].软件.2019

[6].郑尚,孙丹,于化龙.基于模糊加权极限学习机的类不平衡软件缺陷预测[J].江苏科技大学学报(自然科学版).2019

[7].邱少健,蔡子仪,陆璐.基于卷积神经网络的代价敏感软件缺陷预测模型[J].计算机科学.2019

[8].胡梦园,黄鸿云,丁佐华.用于软件缺陷预测的集成模型[J].计算机科学.2019

[9].宫丽娜,姜淑娟,姜丽.软件缺陷预测技术研究进展[J].软件学报.2019

[10].莫有印.应用于软件缺陷预测模型的量子粒子群优化BP算法[J].现代电子技术.2019

标签:;  ;  ;  ;  

软件缺陷预测论文-张志武
下载Doc文档

猜你喜欢