为了解决猪肉TVB-N预测模型在应用中面临的上述具体问题,中国农业大学工学院,国家农产品加工技术装备研发分中心的王文秀、彭彦昆*、王 凡、马 营针对两个批次的猪肉实验样品,基于350~2 500 nm波段的可见-近红外反射光谱矩阵,提出了基于距离、信息测度和投影的相似性度量方法,通过构建相似度函数和相似度因子,建立TVB-N的局部偏最小二乘模型,提高模型的预测能力。
1、原始光谱和TVB-N参考值分析
TVB-N含量范围分别为7.49~44.17 mg/100 g和8.17~39.54 mg/100 g。根据GB 2707—2016《鲜(冻)畜、禽产品》的规定,TVB-N含量小于15 mg/100 g时样品为新鲜肉,可见2 次实验均涵盖了新鲜和腐败的样品,且第1次实验的理化值范围大于第2次实验。
2、第1批次样品建模结果分析
对第1批实验样品的双波段光谱进行数据融合且重排后,利用SNV对光谱进行预处理。然后以3∶1的比例对108 个样品进行分组,则有80 个样品组成校正集建立模型,28 个样品组成验证集对模型进行验证。建立的PLS模型预测性能较好,Rc和Rp分别为0.952 0和0.940 8,SEC和SEP分别为2.286 5 mg/100 g和2.442 4 mg/100 g。
3、直接预测第2批次样品结果分析
一些样品的预测效果不理想,真实值和预测值的偏差较大,总体相关系数R为0.845 6,SEP为4.581 0 mg/100 g。这表明不同批次实验样品之间存在差异,利用建立的模型直接预测不同样品时容易产生较大的误差,模型的适用性需要进一步增强。
4、LPLS模型预测第2批次样品结果分析
本研究结合欧式距离和SID-SAM,可以更加综合全面地评价不同光谱之间的相似性,更有利于找寻与待测样品光谱特征相似的建模样品。通过优化SM值,对每一个待测样品,均能从建模基础数据集样品中动态选择最佳建模邻域窗口。相比在建立LPLS模型时,根据待测样品的光谱特征,在基础数据中以待测样品为中心搜索固定距离空间内的样品,或搜寻与之相似性较高的固定个数的样品,该方法具有更高的灵活性,可根据样品特性实时优选出最佳建模用样品子集。
结 论
计算外部验证样品与建模基础数据集中所有样品的欧式距离和SID-SAM,以权重分别为0.8和0.2对二者进行加权求和,计算出相似度函数。以相似度因子为0.8选择建模邻域,对外部验证的每一个样品构建LPLS预测模型。与利用校正模型直接预测外部验证样品时的结果相比,LPLS模型具有更大的预测能力,相关系数R从0.845 6上升至0.948 1,SEP从4.581 0 mg/100 g下降至2.650 8 mg/100 g。在今后的研究中,收集更多品种和来源的样品组成建模基础数据集,结合本研究的方法,可以实现对更多样品的无损预测。此外,也可将该方法应用于利用可见-近红外光谱法预测猪肉其他参数的研究中。