http://www.paper.edu.cn
- 1 -
遗传算法在鱼粉中肉骨粉含量 NIRS 检测中的应用
1
湛小梅
1,2
,韩鲁佳
1,2
,刘贤
1,2
,杨增玲
1,2
1.中国农业大学工学院,北京(100083)
2. 动物营养学国家重点实验室,北京(100083)
E-mail:chengyuanhel@cau.edu.cn, hanlj@cau.edu.cn
摘 要:利用遗传算法对 64 个掺加了肉骨粉的鱼粉样品近红外光谱进行变量筛选,采用偏
最小二乘法回归建模,并用包含 21 个样品的外部验证集进行验证。遗传算法共选取 310 个
波长变量,相对于全谱的 1556 个变量减少了 80%,与全谱范围的偏最小二乘法相比,交互
验证相关系数(R
CV
)从 0.80 提高到 0.90,交互验证均方根误差(RMSECV)从 5.22%降低
到 3.62%,预测相关系数(R
V
)从 0.91 提高到 0.96,预测均方根误差(RMSEP)从 3.85%
降低到 2.95%,模型的稳健性和预测精度都显著提高。试验结果表明遗传算法可以改善近红
外光谱法预测鱼粉中肉骨粉含量的效果。
关键词 遗传算法;近红外光谱;鱼粉;肉骨粉;检测
中图分类号:S816.48;O657.33
1. 引言
偏最小二乘法(Partial Least Square,PLS)是近红外光谱(NIR)建模的常用方法,传
统观点认为 PLS 具有较强的抗干扰能力,可全波长参与多元校正模型的建立
[1]
。但是随着对
PLS 方法的深入研究和应用,发现通过特定方法筛选变量(特征波长或波长区间)有可能得
到更好的定量校正模型。变量筛选一方面可以简化模型,更主要的是由于不相关或非线性变
量的剔除,可以得到预测能力强、稳健性好的校正模型
[2]
。
遗传算法
[3,4]
(Genetic Algorithm,GA)是应用较广泛的一种变量筛选方法,最初是由
Holland 于 1975 年提出的,它借鉴生物界自然选择和遗传机制,利用选择、交换和突变等算
子的操作,随着不断的遗传迭代,使目标函数值较优的变量被保留,较差的变量被淘汰,最
终达到最优结果。褚小立等
[5]
利用遗传算法对 NIR 测定石油产品有关组成的波长变量进行筛
选,结果表明,通过遗传算法选取波长在简化 PLS 模型的同时也增强了所建立模型的预测
能力,尤其适用于单纯 PLS 较难校正关联的体系。Leardi 等
[6]
利用傅立叶变换红外光谱法预
测聚合物膜中的添加剂浓度,利用遗传算法优选偏最小二乘回归的变量,结果表明遗传算法
选择变量的预测效果与专家选择变量的预测效果相当,说明遗传算法可以可靠的选择变量,
并且不需要经验。Ghasemi 等
[7]
采用近红外光谱法建立锌试剂与被分析物在 PH=9 时反应进
展的偏最小二乘法模型,在建模前先利用遗传算法进行变量选择,用不同浓度的铜锌混合物
进行模型的验证,得到铜和锌浓度的预测均方根误差(RMSEP)分别为 0.0407 和 0.2147,
明显低于全谱建模的结果 0.0865 和 0.3005。Yibin Ying 等
[8]
利用遗传算法选择偏最小二乘回
归的变量,预测梨的糖度、可滴定酸度和有效酸度,与全谱偏最小二乘法相比,变量显著减
少,预测精度显著提高,说明遗传算法可以与偏最小二乘法结合,为不同的预测量选择最佳
的光谱变量。李艳肖等
[9]
采用遗传算法筛选变量,偏最小二乘法建立近红外模型,预测苹果
的糖度。光谱被划分为 40 个区间,遗传算法选取了 5 个区间,得到的 R
C
和 RMSECV 分别
为 0.962 和 0.335,R
V
和 RMSEP 分别为 0.932 和 0.384,与全谱模型相比,遗传算法提高了
模型的预测能力,简化了模型。
1
本课题得到国家自然科学基金项目“基于近红外光谱的肉骨粉快速检测方法研究”(30571074),十一五
国家科技支撑计划子课题“不同种属动物源性饲料原料快速鉴别检测”(2006BAD12B03-03),动物营养学
国家重点实验室自主研发课题资助