Optimizing feature selection with gradient boosting machines in PLS regression for predicting moisture and protein in multi-country corn kernels via NIR spectroscopy

偏最小二乘回归 特征选择 Boosting(机器学习) 化学计量学 水分 梯度升压 近红外光谱 核(代数) 特征(语言学) 回归 交叉验证 人工智能 模式识别(心理学) 生物系统 计算机科学 数学 随机森林 机器学习 统计 化学 生物 组合数学 哲学 语言学 神经科学 有机化学
作者
Runyu Zheng,Yuyao Jia,Chidanand Ullagaddi,Cody W. Allen,Kent D. Rausch,Vijay Singh,James C. Schnable,Mohammed Kamruzzaman
出处
期刊:Food Chemistry [Elsevier BV]
卷期号:456: 140062-140062 被引量:40
标识
DOI:10.1016/j.foodchem.2024.140062
摘要

Differences in moisture and protein content impact both nutritional value and processing efficiency of corn kernels. Near-infrared (NIR) spectroscopy can be used to estimate kernel composition, but models trained on a few environments may underestimate error rates and bias. We assembled corn samples from diverse international environments and used NIR with chemometrics and partial least squares regression (PLSR) to determine moisture and protein. The potential of five feature selection methods to improve prediction accuracy was assessed by extracting sensitive wavelengths. Gradient boosting machines (GBMs), particularly CatBoost and LightGBM, were found to effectively select crucial wavelengths for moisture (1409, 1900, 1908, 1932, 1953, 2174 nm) and protein (887, 1212, 1705, 1891, 2097, 2456 nm). SHAP plots highlighted significant wavelength contributions to model prediction. These results illustrate GBMs' effectiveness in feature engineering for agricultural and food sector applications, including developing multi-country global calibration models for moisture and protein in corn kernels.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Ykn发布了新的文献求助10
刚刚
可爱的半山关注了科研通微信公众号
1秒前
满眼星陈完成签到,获得积分20
2秒前
abc1122完成签到,获得积分10
2秒前
3秒前
3秒前
木头人完成签到,获得积分10
3秒前
4秒前
25jfren发布了新的文献求助10
4秒前
深情安青应助菠菜采纳,获得30
4秒前
4秒前
adamchris发布了新的文献求助30
5秒前
LLT驳回了zyyy应助
5秒前
诸葛藏藏完成签到,获得积分10
5秒前
5秒前
英姑应助lvolt采纳,获得10
5秒前
拼搏靖巧发布了新的文献求助10
6秒前
7秒前
7秒前
7秒前
诸葛藏藏发布了新的文献求助10
7秒前
griffon完成签到,获得积分10
8秒前
8秒前
zlzlzl发布了新的文献求助10
8秒前
巧克力完成签到,获得积分10
9秒前
阔达代芹完成签到,获得积分10
9秒前
大树完成签到 ,获得积分10
9秒前
logic完成签到 ,获得积分10
9秒前
harry发布了新的文献求助10
9秒前
9秒前
10秒前
corner发布了新的文献求助10
10秒前
10秒前
ui24完成签到 ,获得积分10
11秒前
11秒前
lwwwl发布了新的文献求助10
12秒前
lsy完成签到,获得积分10
12秒前
郁金香发布了新的文献求助10
12秒前
小胡完成签到,获得积分10
12秒前
罗明芳发布了新的文献求助10
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
NMR in Plants and Soils: New Developments in Time-domain NMR and Imaging 600
Physical Chemistry: How Chemistry Works 500
SOLUTIONS Adhesive restoration techniques restorative and integrated surgical procedures 500
Energy-Size Reduction Relationships In Comminution 500
Principles Of Comminution, I-Size Distribution And Surface Calculations 500
Cowries - A Guide to the Gastropod Family Cypraeidae. Volume 2: Shells and Animals 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4947698
求助须知:如何正确求助?哪些是违规求助? 4211427
关于积分的说明 13094063
捐赠科研通 3992630
什么是DOI,文献DOI怎么找? 2185617
邀请新用户注册赠送积分活动 1200950
关于科研通互助平台的介绍 1114477