小样本数据下特种材料基因工程的数据扩充方法

随着地下水利、水务管网对材料需求的多样性和复杂性日益加剧,通过机器学习高效便捷地设计满足个性化需求的特种材料成为人们关注的热点。传统监督学习方法均以大量数据训练建模为基础,但从深埋地下水务管网、高端军工设备等领域所需的特种材料,如稀贵高熵合金等获取大数据集,需要的成本极高且周期较长。为了解决该问题,提出了一种小样本扩充模型——RX-SMOGN,使用极致梯度提升模型和使用交叉验证的递归特征消除算法进行特征筛选,使用SMOGN算法扩充数据集。提出以高熵合金相结构为研究对象,训练传统机器学习模型对其进行预测以验证RX-SMOGN模型的有效性。由五折交叉验证及4个评价指标结果可知,RX-SMOGN模型...

Full description

Bibliographic Details
Main Author: 杨涛, 张兆波, 郑添屹, 彭保
Format: Article
Language:zho
Published: China InfoCom Media Group 2024-01-01
Series:大数据
Subjects:
Online Access:https://www.infocomm-journal.com/bdr/CN/10.11959/j.issn.2096-0271.2024019
_version_ 1797323596977143808
author 杨涛, 张兆波, 郑添屹, 彭保
author_facet 杨涛, 张兆波, 郑添屹, 彭保
author_sort 杨涛, 张兆波, 郑添屹, 彭保
collection DOAJ
description 随着地下水利、水务管网对材料需求的多样性和复杂性日益加剧,通过机器学习高效便捷地设计满足个性化需求的特种材料成为人们关注的热点。传统监督学习方法均以大量数据训练建模为基础,但从深埋地下水务管网、高端军工设备等领域所需的特种材料,如稀贵高熵合金等获取大数据集,需要的成本极高且周期较长。为了解决该问题,提出了一种小样本扩充模型——RX-SMOGN,使用极致梯度提升模型和使用交叉验证的递归特征消除算法进行特征筛选,使用SMOGN算法扩充数据集。提出以高熵合金相结构为研究对象,训练传统机器学习模型对其进行预测以验证RX-SMOGN模型的有效性。由五折交叉验证及4个评价指标结果可知,RX-SMOGN模型充分提高了机器学习模型的性能,为合金材料设计提供了一种更便捷的方法,充分提高了合金材料设计的效率。
first_indexed 2024-03-08T05:30:55Z
format Article
id doaj.art-7466c0d7bcfd40f1b433acdf2ba4352a
institution Directory Open Access Journal
issn 2096-0271
language zho
last_indexed 2024-03-08T05:30:55Z
publishDate 2024-01-01
publisher China InfoCom Media Group
record_format Article
series 大数据
spelling doaj.art-7466c0d7bcfd40f1b433acdf2ba4352a2024-02-06T05:53:52ZzhoChina InfoCom Media Group大数据2096-02712024-01-0110118519410.11959/j.issn.2096-0271.2024019小样本数据下特种材料基因工程的数据扩充方法杨涛, 张兆波, 郑添屹, 彭保随着地下水利、水务管网对材料需求的多样性和复杂性日益加剧,通过机器学习高效便捷地设计满足个性化需求的特种材料成为人们关注的热点。传统监督学习方法均以大量数据训练建模为基础,但从深埋地下水务管网、高端军工设备等领域所需的特种材料,如稀贵高熵合金等获取大数据集,需要的成本极高且周期较长。为了解决该问题,提出了一种小样本扩充模型——RX-SMOGN,使用极致梯度提升模型和使用交叉验证的递归特征消除算法进行特征筛选,使用SMOGN算法扩充数据集。提出以高熵合金相结构为研究对象,训练传统机器学习模型对其进行预测以验证RX-SMOGN模型的有效性。由五折交叉验证及4个评价指标结果可知,RX-SMOGN模型充分提高了机器学习模型的性能,为合金材料设计提供了一种更便捷的方法,充分提高了合金材料设计的效率。https://www.infocomm-journal.com/bdr/CN/10.11959/j.issn.2096-0271.2024019小样本扩充特征工程机器学习高熵合金稀贵金属
spellingShingle 杨涛, 张兆波, 郑添屹, 彭保
小样本数据下特种材料基因工程的数据扩充方法
大数据
小样本扩充
特征工程
机器学习
高熵合金
稀贵金属
title 小样本数据下特种材料基因工程的数据扩充方法
title_full 小样本数据下特种材料基因工程的数据扩充方法
title_fullStr 小样本数据下特种材料基因工程的数据扩充方法
title_full_unstemmed 小样本数据下特种材料基因工程的数据扩充方法
title_short 小样本数据下特种材料基因工程的数据扩充方法
title_sort 小样本数据下特种材料基因工程的数据扩充方法
topic 小样本扩充
特征工程
机器学习
高熵合金
稀贵金属
url https://www.infocomm-journal.com/bdr/CN/10.11959/j.issn.2096-0271.2024019
work_keys_str_mv AT yángtāozhāngzhàobōzhèngtiānyìpéngbǎo xiǎoyàngběnshùjùxiàtèzhǒngcáiliàojīyīngōngchéngdeshùjùkuòchōngfāngfǎ