奥克兰理工大学和奥克兰大学研究人员分析了机器学习的乳制品加工数据

挑战

确保新西兰牛奶加工厂的高品质奶粉生产一致

解决方案

使用MATLAB进行预处理并使来自多个工厂的数据,分析和可视化数据,以及开发能够预测粉末功能性质的机器学习模型

结果

  • 识别并纠正关键过程缺陷
  • 在数小时内评估多个机器学习分类器
  • 大数据集易于处理;手工流程自动化

“与我们的行业合作伙伴坐下来,看着他们看到我们使用MATLAB的效率,以及我们分析和绘制数据的速度,这是一件很棒的事情。我们的结果使他们能够证实他们缺乏证据的假设,并激发了过程改进的新想法。”

David Wilson,工业信息与控制中心

三种粉末加工厂植物过程变量PCA分析的3D曲线图及六年数据。分析表明,尽管生产具有相同规格的产品,但每厂都存在于完全独立的操作空间中。下载188bet金宝搏


工业信息和控制中心(I2C2)是奥克兰理工大学(AUT)与奥克兰大学之间的联合研究所。建立了改善新西兰乳制品和其他出口行业的过程仿真和控制。

该研究所的工业合作伙伴之一是恒天然(Fonterra),该国最大的奶粉生产商。在最近的一个项目中,我2C2研究人员开发了机器学习模型,帮助Fonterra优化产品质量和简化生产过程。

使用MATLAB®统计和机器学习工具箱™,研究人员分析了从新西兰多个生产设施收集的数据,以根据工艺条件预测奶粉的功能特性。

“MATLAB的广度是我们用于统计分析的其他环境所无法比拟的,”I2C2AUT电气和电子工程系副教授。“与MATLAB一起,我们在一个环境中使用大量信息,而不需要将大型数据集从一个工具移动到另一个工具。”

挑战

通过其化学组成,例如脂肪和蛋白质含量的化学组成来评估奶粉质量,以及物理和功能性,例如堆积密度和溶解度,但是通过现有的工业过程相对较好地调节化学组成,确保了一致的功能性质已被证明是更多的具有挑战性的。产生粉末的植物在设计和年龄方面的广泛变化,并且经常使用巨大的过程设置。结果,当一批粉末具有可变质量的产生时,确定出现问题,何时可能是有问题的。

部分受食品和药物管理局设计质量和过程分析技术倡议的推动,I2C2研究人员出发了分析数百万行时间序列数据(包括温度和其他记录的过程变量,以及物理和功能性质的测量值),来自三个不同的加工厂在六年内。如收集,原始数据不一致,并且不完全一致。在过程测量和产品值之间没有共同的参考,有时会导致缺失数据的记录错误和仪器故障,不同数据集的时间戳处于不同的格式。

然而,该小组需要使用这些数据来确定当某一特定样品生产时,工厂是在什么条件下运行的。然后,他们需要确定哪些异常情况导致了不同质量的奶粉,并建议纠正这些异常情况的程序。理想情况下,修正必须在工厂运行时进行,而不是几小时或几天后,当相关的实验室测试结果可用时进行。

解决方案

一世2C2使用MATLAB进行预处理并对齐来自牛奶加工厂的数据,分析和可视化数据,以及开发能够预测牛奶粉功能性能的机器学习模型。

在Matlab工作,我2C2研究人员从恒天然的数据库中提取工艺数据。清理和对齐数据涉及使用插值估计缺失数据的值,并通过解释以多种格式生成的时间戳来对齐不同的数据集。

一旦团队有了一组干净的数据,他们使用统计学和机器学习工具箱来执行统计分析,使用主成分分析(PCA)和偏最小二乘(PLS)回归。该团队用MATLAB 3D直方图、散点图和其他图形补充了多元分析,以可视化结果,并与恒天然的工程师分享他们的发现。

继续在matlab,我2C2团队使用最低的绝对收缩和选择操作员(套索)方法实现了更高级的回归模型,并评估了各种机器学习分类器。

最初,分类器的预测准确率不到50%。这是因为训练数据只包括奶粉加工参数显著变化时记录的少数数据实例。虽然这样的实例数量很少,但它不能为模型构建提供足够的数据。为了纠正这个问题,团队对训练数据中的不合格样本进行了上采样,对剩余样本进行了下采样。

为了提高预测准确性,他们使用重采样的训练数据来评估其他分类器类型。通过分类学习者应用程序,他们迅速评估了20多分类器,包括支持向量机,K-CORMOLT邻居以及各种决策树,包括促进树木和袋装决策树。金宝app他们最终发现增强树木最佳地工作,预测精度差约95%。

一世2C2研究人员目前将自动图像处理集成到他们的分析工作流程中。使用图像处理工具箱™,该团队分析了数千张奶粉颗粒的照片,计算粒度,凸性,圆形度和其他形状因子,并将这些度量与粉末的功能性质相关联。

结果

  • 识别和纠正的关键过程缺陷。“在我们合作伙伴的一家工厂,向奶粉中添加关键成分的工艺不时出现故障,工厂经理无法确定故障的原因,”I2C2奥克兰大学博士后研究员。“我们在MATLAB中进行的逐步分析使我们能够确定问题的原因,现在已经解决了。”
  • 多个机器学习分类器在小时内进行评估。“有了Classification Learner应用,我们在一个下午就尝试了支持向量机和其他几种分类器类型,看看哪一种对我们的数据最有效,”David说。金宝app“因为我们之前在机器学习方面没有什么经验,否则我们可能要花上几个月的时间。”
  • 大数据集易于处理;手工流程自动化。“过去我们用于多变量分析的工具未能处理我们的较大的数据集,但Matlab与他们没有问题,”贬值。“同样,在微软手动上创建我们与Fonterra共享的报告是不可能的®Excel®。使用MATLAB,我们自动化此过程并从多个工厂的数据和多年来生成数百个图表。“

下载188bet金宝搏使用的产品

展示你的成功

加入客户参考计划