基于样本冗余控制的材料属性机器学习预测模型

基于样本冗余控制的材料属性机器学习预测模型

论文摘要

当前基于机器学习的材料属性预测研究中,通常采用数据库获取的所有数据样本,通过计算其高维向量表示来训练预测模型。然而材料数据库样本的高冗余性导致了训练的模型具有很强的偏向性和过拟合的现象。为此,提出一种剔除数据集中冗余性样本的算法,从数据集中选择具有代表性样本;通过使用多种机器学习算法预测材料属性并进行比较,结果表明如果没有实行基准数据集的冗余控制,即使是随机原始数据集也可以由于高冗余样本而得到很好的预测性能指标;研究还发现使用具有代表性样本进行训练实际可以帮助训练出具有更高泛化能力和更具预测性的模型。因此,提出降低冗余度是评估材料性能预测模型的必要步骤。

论文目录

  • 1 数据集表征和冗余处理
  •   1.1 数据表征方法
  •     (1)Periodfeature表征方法。
  •     (2)Atom2vec表征方法。
  •   1.2 数据集的样本冗余处理
  • 2 实验方法
  •   2.1 线性回归(linear regression,LR)
  •   2.2 随机森林回归(random forest for regression,RFR)
  •   2.3 支持向量机回归(support vector regression,SVR)[17]
  • 3 实验结果与分析
  • 4 结论
  • 文章来源

    类型: 期刊论文

    作者: 李想,李少波,但雅波,董容智,曹卓,牛程程,胡建军

    关键词: 机器学习,特征选择,冗余度,材料属性,材料性能预测

    来源: 科学技术与工程 2019年34期

    年度: 2019

    分类: 工程科技Ⅱ辑,工程科技Ⅰ辑,信息科技

    专业: 材料科学,自动化技术

    单位: 贵州大学机械工程学院,贵州大学现代制造技术教育部重点实验室,美国南卡罗来纳大学计算机科学与工程系

    基金: 国家自然科学基金(51741101),黔科合平台人才[2018]5781号资助

    分类号: TB305;TP181

    页码: 278-283

    总页数: 6

    文件大小: 1263K

    下载量: 105

    相关论文文献

    • [1].改进灰色预测模型在热电厂热负荷预测中的应用[J]. 电力学报 2019(06)
    • [2].西安地区卒中患者1年卒中复发预测模型的构建[J]. 中国卒中杂志 2020(01)
    • [3].常用统计预测模型及其在结核病疫情预测中的应用[J]. 热带病与寄生虫学 2020(01)
    • [4].预测模型法在油田二次开发中的应用[J]. 云南化工 2020(04)
    • [5].基于灰色预测模型的舰船动力系统故障检测算法[J]. 舰船科学技术 2020(08)
    • [6].社区老年人居家不出危险因素分析及风险预测模型构建[J]. 护理学报 2020(08)
    • [7].高炉煤气流分布过程的多算法融合预测模型[J]. 控制理论与应用 2020(06)
    • [8].压力性损伤风险预测模型的研究进展[J]. 中华护理杂志 2020(04)
    • [9].无诱因复发性静脉血栓预测模型的研究进展[J]. 同济大学学报(医学版) 2020(03)
    • [10].一种可预测弥漫大B细胞淋巴瘤患者生存的新型6基因预测模型[J]. 中国癌症防治杂志 2020(03)
    • [11].基于序列特征的点击率预测模型[J]. 华东师范大学学报(自然科学版) 2020(04)
    • [12].基于灰色理论的生态经济警度预测模型及其应用[J]. 统计与决策 2020(13)
    • [13].临床预测模型:新预测因子的预测增量值[J]. 中国循证心血管医学杂志 2020(06)
    • [14].基于在校数据挖掘的大学生心理抑郁预测模型以及分析[J]. 中国新通信 2020(17)
    • [15].灰色预测模型在公共卫生事件胜利日预测中的应用——以新型冠状病毒疫情为例[J]. 卫生软科学 2020(11)
    • [16].临床预测模型:模型的建立[J]. 中国循证心血管医学杂志 2019(01)
    • [17].零转弯半径割草机连续翻滚特性参数化预测模型[J]. 农机化研究 2018(01)
    • [18].基于情景数据的火灾预测模型设计与实现[J]. 科技创新与应用 2018(26)
    • [19].灰色预测模型在预测话音网关故障中的研究与应用[J]. 计算机测量与控制 2016(11)
    • [20].应用预测模型对云南省2020年生产总值的预测[J]. 科技创新导报 2016(32)
    • [21].灰色预测模型在山东省保费预测中的应用[J]. 保险职业学院学报 2017(01)
    • [22].基于灰色预测模型的山西省批发零售业人员需求分析[J]. 数学的实践与认识 2017(04)
    • [23].烧结过程SO_2排放预测模型研究[J]. 资源节约与环保 2017(08)
    • [24].混沌时间序列的2阶预测模型[J]. 数学的实践与认识 2016(05)
    • [25].建设项目环境影响评价预测模型发展现状[J]. 绿色科技 2016(08)
    • [26].多项式预测模型在沉降变形监测当中的应用[J]. 矿山测量 2015(02)
    • [27].疾病发病风险预测模型的应用与建立[J]. 中国卫生统计 2015(04)
    • [28].基于大数据背景下出版产业人才需求综合预测分析[J]. 明日风尚 2017(19)
    • [29].一类优化的预测模型[J]. 山西青年 2013(24)
    • [30].一种基于大数据的脱贫预测模型构建研究[J]. 无线互联科技 2019(21)

    标签:;  ;  ;  ;  ;  

    基于样本冗余控制的材料属性机器学习预测模型
    下载Doc文档

    猜你喜欢