垃圾邮件过滤论文_张柳艳

导读:本文包含了垃圾邮件过滤论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:垃圾邮件,朴素,向量,算法,邮件,阈值,段式。

垃圾邮件过滤论文文献综述

张柳艳[1](2019)在《基于SDA的中文垃圾邮件过滤研究》一文中研究指出随着互联网技术的高速发展,电子邮件以其成本低廉、传输便利的优势在互联网上被广泛使用,逐步成为人们重要的一种交流通信工具。但是在商业利益的驱动下,企业和个人经常通过群发邮件进行营销,使得用户收到的垃圾邮件数量远远超于正常邮件数量。据统计,在2018年全球虚假电子邮件的日发送量估计已高达64亿,过去几年中,企业电子邮件诈骗(BEC诈骗)损失成本已达到120亿美元。由此可见,对反垃圾邮件技术的研究不可或缺。传统垃圾邮件过滤方法在中文垃圾邮件过滤中存在准确率不高、数据特征难以提取的问题,而浅层神经网络模型在垃圾邮件过滤中不能表示复杂的目标函数,训练时容易陷入局部最优。本文提出了基于SDA的中文垃圾邮件过滤方法,首先对深度网络进行无监督逐层预训练,初始化网络参数;然后通过有监督学习对网络参数进行反向微调,获取最优的模型参数;该深度网络模型可以很好的对短文本中文垃圾邮件进行过滤,并针对深度网络在训练时速度慢、模型鲁棒性差、容易受噪音影响以及容易出现过拟合等特点,对模型进行了优化和改进。本文主要的工作如下:(1)本文采用TREC06C数据集,提取其中的11360条短文本中文垃圾邮件数据正文作为样本数据,然后通过训练Word2vec中CBOW模型来获取深度网络分类所需要的词向量,并将自然语言处理中的深度学习模型堆迭式降噪自编码器应用于中文垃圾邮件中;(2)由于深度网络在训练时极容易发生过拟合现象,本文在深度网络中加入Dropout技术来防止网络过拟合,实验表明:网络中添加了Dropout后,结果更加平稳,网络的泛化效果更好;(3)本文采用的W2C_SDA深度网络中文垃圾邮件过滤模型是一个混合的深度网络,它由堆迭式降噪自编码器和Softamx分类器组合而成;为了提高网络的收敛速度和缓解过拟合现象,在Softmax分类器中加入了L2正则化,实验表明:添加了L2正则化后,网络收敛速度加快,准确率提高了0.2%;(4)通过实验获得W2C_SDA模型最优参数,并且在一个数据集上与伯努利贝叶斯过滤模型和KNN过滤模型的分类效果进行对比,实验表明:与贝叶斯过滤模型和KNN过滤模型相比较,该方法在中文垃圾邮件过滤效果更好。(本文来源于《南昌航空大学》期刊2019-06-01)

钟福连[2](2018)在《基于BPNN的AdaBoost垃圾邮件过滤算法研究》一文中研究指出垃圾邮件泛滥成灾,影响了网络的正常运行及人们的生活质量。文中以BPNN作为弱分类器,使用Ada Boost算法,将多个BPNN弱分类器组成一强分类器BPNN_AdaBoost。结果显示,BPNN_AdaBoost模型的准确率优于BPNN模型。该实验证明强分类器分类的准确率明显高于弱分类器的准确率6%以上,其中误判率与漏判率皆降低,表明BPNN_AdaBoost分类模型取得良好的效果。(本文来源于《长沙民政职业技术学院学报》期刊2018年04期)

刘浩然,丁攀,郭长江,常金凤,崔静闯[3](2018)在《基于贝叶斯算法的中文垃圾邮件过滤系统研究》一文中研究指出目前大部分中文垃圾邮件过滤系统受文本稀疏及模型特征局限的影响较大,其特征高维和特征局限的缺陷成为制约过滤效果的重要因素。针对特征高维问题,提出一种基于中心词扩展的TF-IDF(term frequency-inverse document frequency)特征提取算法,增加了特征节点的表达能力,实现了特征降维。针对分类模型特征局限和属性间条件独立性假设不成立问题,提出一种基于GWO_GA(grey wolf optimizer-genetic algorithm)结构学习算法的3层贝叶斯网络模型,放松了条件独立性假设,增加了特征多样性,最终形成基于中心词扩展的TF-IDF特征提取及GWO_GA结构学习的3层贝叶斯算法。通过大量中文邮件数据验证,算法可明显提高中文垃圾邮件过滤效果。(本文来源于《通信学报》期刊2018年12期)

李玉峰,米晓琴,杨婷[4](2019)在《Windows下SpamAssassin对中文垃圾邮件的过滤研究》一文中研究指出英文垃圾邮件过滤效果良好的开源软件Spam Assassin,在Windows下的应用研究较少。在Windows下安装配置Spa-m Assassin,针对中文邮件添加规则与学习贝叶斯库,基于真实邮件测试,取得了良好过滤效果。(本文来源于《内蒙古农业大学学报(自然科学版)》期刊2019年01期)

金京犬[5](2018)在《Linux系统下基于postfix垃圾邮件过滤方法》一文中研究指出针对垃圾电子邮件存在的安全隐患,对Linux系统下postfix垃圾邮件过滤方法进行深入研究,并在此基础上设计了结合smtp和ssl机制验证客户端发送邮件人的身份的方法。实验表明:该方法能够有效阻止垃圾邮件入侵用户邮箱,提高了邮件系统的安全性,实现了指定用户的邮件收发功能。(本文来源于《新乡学院学报》期刊2018年09期)

王斌[6](2018)在《基于朴素贝叶斯算法的垃圾邮件过滤系统的研究与实现》一文中研究指出针对垃圾邮件泛滥的问题,本文基于朴素贝叶斯算法构建了邮件过滤系统,并采取平滑、归一化等方法进行数据预处理,提取结构与统计特征,通过邮件地址、邮件内容等多个方式进行过滤。计算机测试后表明本算法提高了垃圾邮件识别精度与准确率。(本文来源于《电子设计工程》期刊2018年17期)

丁迎春,施芳芳[7](2018)在《两段式反垃圾邮件过滤方法的研究与实现》一文中研究指出电子邮件给人们通信带来便利的同时,垃圾电子邮件也泛滥成灾,设计一种有效防垃圾邮件的方法势在必行,单纯利用支持向量机与朴素贝叶斯算法仍存在局限性,将支持向量机超平面快速分类的特点与朴素贝叶斯算法的弹性相结合,设计实现两段式的垃圾邮件过滤方法。(本文来源于《电脑知识与技术》期刊2018年23期)

刘月峰,张亚斌,苑江浩[8](2018)在《云环境下NB算法的垃圾邮件过滤研究》一文中研究指出朴素贝叶斯算法在解决垃圾邮件分类领域内具有较高的准确性,能够很好的将邮件区分开来,但是在分类前期的训练阶段却会大量耗用系统和网络资源,严重影响分类效率.为此引入spark平台.以并行的思想去解决邮件分类问题,利用spark计算平台RDD的血缘关系合理的安排NB邮件分类的各个过程.实验结果表明,与其他传统的分类方法对比而言,朴素贝叶斯在精确率,召回率等方面具有很好的效果,并且与传统单机下的邮件分类,本次实验因引入分布式的思想,利用spark集群的优势大大加快了分类的速率.(本文来源于《微电子学与计算机》期刊2018年08期)

徐梦龙,黄家旺[9](2018)在《朴素贝叶斯算法在垃圾邮件过滤方面的应用》一文中研究指出现在电子邮件应用广泛,但各种各样的垃圾邮件造成的困扰也日益严重。在诸多垃圾邮件过滤的方法中,朴素贝叶斯算法取得了良好的效果。本文先简单介绍贝叶斯模型,给出一种基于朴素贝叶斯分类模型的电子邮件过滤方法,并简单分析其缺点。最后通过实验验证其有效性。(本文来源于《网络安全技术与应用》期刊2018年07期)

詹鹏伟,谢小姣[10](2018)在《朴素贝叶斯及其改进算法在垃圾邮件过滤中的应用》一文中研究指出朴素贝叶斯模型在文本分类领域应用广泛,但因为算法本身的缺陷,分类性能有待提高。文章在传统的朴素贝叶斯模型的基础上,利用对数处理解决了算术下溢问题,使用拉普拉斯平滑解决了因训练集过小出现的零概率问题,并采用了系数加权的方法改善了朴素贝叶斯因假设所有条件都是独立的而导致的性能问题,进一步根据垃圾邮件过滤必须要有的查准率高的特点提出了阈值限定条件,最终训练的出的模型分类效果较传统的朴素贝叶斯模型有所提高,对垃圾邮件过滤模型的设计有一定的指导作用。(本文来源于《科技创新与应用》期刊2018年20期)

垃圾邮件过滤论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

垃圾邮件泛滥成灾,影响了网络的正常运行及人们的生活质量。文中以BPNN作为弱分类器,使用Ada Boost算法,将多个BPNN弱分类器组成一强分类器BPNN_AdaBoost。结果显示,BPNN_AdaBoost模型的准确率优于BPNN模型。该实验证明强分类器分类的准确率明显高于弱分类器的准确率6%以上,其中误判率与漏判率皆降低,表明BPNN_AdaBoost分类模型取得良好的效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

垃圾邮件过滤论文参考文献

[1].张柳艳.基于SDA的中文垃圾邮件过滤研究[D].南昌航空大学.2019

[2].钟福连.基于BPNN的AdaBoost垃圾邮件过滤算法研究[J].长沙民政职业技术学院学报.2018

[3].刘浩然,丁攀,郭长江,常金凤,崔静闯.基于贝叶斯算法的中文垃圾邮件过滤系统研究[J].通信学报.2018

[4].李玉峰,米晓琴,杨婷.Windows下SpamAssassin对中文垃圾邮件的过滤研究[J].内蒙古农业大学学报(自然科学版).2019

[5].金京犬.Linux系统下基于postfix垃圾邮件过滤方法[J].新乡学院学报.2018

[6].王斌.基于朴素贝叶斯算法的垃圾邮件过滤系统的研究与实现[J].电子设计工程.2018

[7].丁迎春,施芳芳.两段式反垃圾邮件过滤方法的研究与实现[J].电脑知识与技术.2018

[8].刘月峰,张亚斌,苑江浩.云环境下NB算法的垃圾邮件过滤研究[J].微电子学与计算机.2018

[9].徐梦龙,黄家旺.朴素贝叶斯算法在垃圾邮件过滤方面的应用[J].网络安全技术与应用.2018

[10].詹鹏伟,谢小姣.朴素贝叶斯及其改进算法在垃圾邮件过滤中的应用[J].科技创新与应用.2018

论文知识图

、pu2、pu3和pua数据集中文本的编...基于图片特征和分类器融合的垃圾邮垃圾邮件过滤系统模型垃圾邮件过滤系统模型1垃圾邮件过滤在线模式校园网垃圾邮件过滤系统过滤垃圾...

标签:;  ;  ;  ;  ;  ;  ;  

垃圾邮件过滤论文_张柳艳
下载Doc文档

猜你喜欢