机器学习项目(一)工业离散制造过程中的符合率业务需求问题

工业离散制造过程中的符合率业务需求问题

前期知识储备

机器学习三大件:Numpy Matplotlib Pandas
表格型数据 数据挖掘算法:有监督、无监督
机器学习神奇-Sklearn:Sklearn的机器学习算法的应用

大背景—— 智能制造带来的革命性影响(工业4.0)

业务场景分析

在高端制造领域,随着数字化转型的深入推进,越来越多的数据可以被用来分析和学习,
进而实现制造过程中重要决策和控制环节的智能化,例如生产质量管理。
从数据驱动的方法来看,生产质量管理通常需要完成质量影响因素挖掘及质量预测、质量控制优化等环节,
本赛题将关注与第一个环节,基于对潜在的相关参数及历史生产数据进行分析,完成质量相关因素的确认和最终质量符合率的预测。
在实际生产中,该环节的结果将是后续控制优化的重要依据

选题

赛题链接

赛题任务

由于在实际生产中,同一组工艺参数设定下生产的工件会出现多种质检结果,所以我们针对各组工艺参数定义其质检标准符合率,即为该组工艺参数生产的工件的质检结果分别符合优、良、合格与不合格四类指标的比率。相比预测各个工件的质检结果,预测该质检标准符合率会更具有实际意义。

本赛题要求参赛者对给定的工艺参数组合所生产工件的质检标准符合率进行预测。

数据简介DATA BACKGROUD

在此任务中,以某典型工件生产过程为例,我们将提供给参赛者一系列工艺参数,以及在相应工艺参数下所生产工件的质量数据。该数据来源于某工厂采集的真实数据,已做脱敏处理。

(1)训练数据将提供:

A:工艺参数(如设备加工参数)

B:工件的质量数据

C:工件所符合的质检指标

(2)测试数据将提供:

A:工艺参数(如设备加工参数)

数据说明DATA DESCRIPTION

(1)初赛训练数据集文件名称为first_round_training_data.csv,csv格式,其中包含21个字段,6000行,含A,B,C三类数据,
(2)初赛测试数据集文件名称为first_round_testing_data.csv,包含11个字段,仅提供A类数据,

提交要求REQUIREMENTS ON WORKS

(1)参赛者提交的结果文件需为csv格式,其中包含5个字段,要求参赛者提供测试数据集中所有工艺参数组别的计算结果,
(2)初赛阶段结果提交方式为csv结果提交:针对算法竞赛,参赛者以csv文件格式,提交模型结果到大数据竞赛平台,平台进行在线评分,实时排名。

项目思路

1.从数据出发
2.EDA发现奇妙点
3.数据预处理
4.算法选型
5.模型部署

技术方案—— 初步制定

数据 Table DataMining Classification
分类算法 Ensemble Xgb Lgb Catboost 神经网络

发布了21 篇原创文章 · 获赞 0 · 访问量 214

猜你喜欢

转载自blog.csdn.net/qq_33357094/article/details/104563721