北京工商大学计算机与信息工程学院,食品安全大数据技术北京市重点实验室的郭培源、徐 盼、董小栋、许晶晶采用400~1 000 nm高光谱仪采集香肠的高光谱数据,并分别采用迭代决策树(GBDT)和支持向量回归(SVR)方法建立香肠菌落总数的预测模型,以期为香肠菌落总数的快速定量和品质控制提供参考。
1、SVR建模结果
SVR方法采用PSO算法进行c和g参数寻优得到的预测模型最优。PSO算法的收敛速度快,受问题维数的变化影响较小,使得求解过程更容易计算。
2、GBDT建模结果
迭代2 000 次得到的建模结果最好,并且迭代过程很快。
3、两种方法建模结果的比较
由SVR和GBDT的建模结果,比较采用PSO算法进行参数寻优的SVR建模结果与迭代2 000 次的GBDT建模结果可知,GBDT建模结果要远优于SVR的,GBDT所得的RMSE非常小,比SVR所得的要小一个数量级,并且GBDT所得的R2几乎为1。除此之外,SVR建模所需的训练时间很长,GBDT训练时间则很短。因而基于高光谱成像技术利用GBDT方法预测香肠菌落总数的方法可行且有效。
结 论
本实验通过高光谱成像系统采集50 个香肠样本的高光谱数据,并利用高光谱分析处理软件ENVI5.1,在每个香肠样本的高光谱图像中选择10 个ROI,从而获得500 个香肠样本的平均光谱数据。实验采用MSC方法对光谱预处理,并采用PCA方法从128 个光谱波段中选择5 个特征波段,从而提高了模型的预测精度。以处理过的光谱数据作为输入,理化实验所得的香肠菌落总数值作为输出,分别采用SVR和GBDT方法建立香肠菌落总数的预测模型。实验结果可知,迭代2 000 次的GBDT建模结果最优。本实验中,GBDT模型迭代2 000 次时,训练集和测试集的RMSE都很小,R2也都接近1,但是当迭代次数多于2 000 次时,是否会产生过拟合、建模效果需要进一步论证。除此之外,进一步需要探索研究地是,将每个像素点下预测出的菌落总数定量反演到香肠样本表面图像上,生成可视化分布图,使香肠新鲜度的动态变化趋势更加直观、形象地呈现。