现代化养猪——养殖大数据


前言
这几年养猪行业正在发生革命性的变化,高端猪肉、安全猪肉、品牌猪肉等特色猪肉的出现,一方面保证了食物的质量,另一方面也提升了溢价能力。基于人工智能养的猪,从出生之日起就有自己的数字档案,里面记载了猪的品种、日龄、体重、进食情况、运动强度、频次、轨迹等信息;用视频图像分析检测猪的体态,分析猪的健康状况;结合声学特征和红外测温技术,还能对猪的咳嗽等行为判断是否患病,做出疫情预警,马云家的猪、阿里的“智能猪”就是很成功的例子。


一、问题回顾
1.1 问题背景
作为一个养猪大国,养猪水平相较于发达国家还是存在相当大的差距。据数据统计,欧美国家的母猪一年能够商品猪的能力在30-40头,而我国仅能提供17-18头。近年来,我国的养猪行业正向着现代化、标准化发展。在现代化畜牧养殖场中,往往已实现了半自动化,例如,自动投喂、自动清粪系统、自动环境控制系统等,自动化设备可以反馈一些状态数据,而且通过传感器可以收集到一定的结构化数据,同时,需人工判断与记录的数据也会很好地按既定格式保存在服务器中,以上我们称之为养殖大数据。
1.2 问题解决
数据准备:
a.传感器采集的饲养方案数据。如温度、湿度、饲喂饲料量等。未来随着物联网技术的发展,将有更多的数据可通过传感器收集,如体温、运动图像等。
b.人工采集并记录的种猪数据。如品种、胎次、疾病情况、肥瘦程度等。
c.种猪的生产成绩。主要是生仔总数和健康仔猪数。其中以健康仔猪数为最重要的指标,但健康仔猪数占生仔总数的比例也需考虑提升。
基于收集到的三类数据(a,b,c)解决以下问题
建立关系分析模型,以参数形式表征自变量对猪的生产成绩的影响程度;
对(1)中影响较大的因素记为显著因子,建立显著因子对猪的生产成绩的影响的模型,求出最优解或最优解的趋势。
1.3 研究意义
第一,我国人口较大,需求量巨大,但养猪行业生产水平较低,严重影响了我国养猪事业的发展,因此,推动养猪行业的自动化、现代化发展有助于满足人类的需求,还能销往邻国谋取经济效益;
其次,改善猪肉的质量,杜绝“瘦肉精”的出现,从而人们能够放心吃肉,敢于吃肉;
最后,随着技术的应用,促进了对养猪技术的研究,养猪科学探索的深入,不断产生新技术、新理念,更好地服务于养猪企业。
二、模型假设
基于数据,假设猪的生产成绩只与温度、湿度、品种、胎次、肥瘦程度和患病情况有关
假设给出的数据都是有效的
假设没有重大的疫情导致猪的死亡
三、模型建立
3.1 问题分析

对于问题(1),建立关系分析模型以参数形式表征种猪的生产成绩的影响程度。由于数据中给出的影响指标有11个之多,包括日平均温度、日平均湿度、周平均饲喂量、猪品种、肥瘦程度、胎次、是否患蓝耳病、是否患圆环病、是否患仔猪黄白痢、是否患病毒性腹泻以及是否患支原体肺炎,考虑到各变量间并非一定相对独立,所以决定先根据定性分析和定量分析相结合对其进行分组,即降维,再研究各变量组对猪生产成绩的影响。

3.2 指标分组
1)定性分析
定性分析是依据现实经验和主、客观分析方法,对于某种事物的本质属性、发展趋势或多种事物之间的相关关系基于直观、概括性表述的一种分析方法。由生活经验可预测变量间的相关性,从而大致研究以下几组:
日平均温度与日平均湿度
品种、饲喂量和肥瘦程度
胎次与是否患病
肥瘦程度与是否患病
品种与是否患病
2)定量分析
定量分析是指在数学方法基础上,通过研究社会现象的数量特征、数量关系和数量变化,对发展趋势进行分析、预测和解释。

相关性分析
为了使得效果显著,先用对数函数对温度、湿度值进行转化,再通过excel散点图分析各变量间相关性,得到图1-3:
 
 

分析可知,日平均温度和日平均湿度的相关系数为0.0189,所以可以认为两者不相关(见图1);周平均饲喂量与猪的肥瘦程度的相关系数为0.8197,两者有较强的相关性,且是负相关的关系,猪越胖,饲喂量就会减少(见图2);品种与猪的肥瘦程度的相关系数为0.00001,非常弱,说明两者完全不相关(见图2);胎次与猪的肥瘦程度没有关系(见图3) 。


独立性检验分析
由于“是否患病”变量是布尔类型,只有“患病”、“不患病”,即1和0两种结果,所以不适合用散点图进行相关性分析,这时可用考虑独立性检验分析法。
独立性检验是检验两个分类变量X和Y是否有关系的一种统计方法,利用随机变量确定在多大程度上可以认为“两个分类变量有关系”,其中令X={x1,x2},Y={y1,y2}。

检验步骤:
步骤1:假设X和Y有关系
步骤2:建立2×2列联表
步骤3:计算观测值
其中观测值越大,X和Y有关系的可能性越大。
步骤4:对比临界值表

步骤5:得出结论


在实现之前,先对数据作以下处理:
鉴于猪的肥瘦程度在12-20之间,故将其划分为两部分,16-20之间表示肥胖,用1表示;12-15之间表示瘦弱,用0表示;
品种1、2分别转换为0、1

在matlab实现5种疾病、品种与肥瘦程度的相关性程度,得到猪的肥瘦程度与5种疾病、品种的观测值:
对比临界值表发现,只有第二种疾病(即圆环病)与猪的肥瘦程度有较大的关系,超过85%的把握认为两者有关。

3)确定分组
根据前面的分析大致将影响猪的生产成绩的因素分为5组,分别是
A组:日平均温度
B组:日平均湿度
C组:饲喂量、猪的肥瘦程度、圆环病
D组:胎次
E组:是否患病
3.3 建立模型
1)多元回归
设因变量为y,k个自变量分别为x1,x2,…,xk,描述因变量y如何依赖于自变量x1,x2,…,xk和误差项ε的方程称为多元回归模型。 针对5组影响因素建立猪的生产成绩的回归模型如下:
其中Y表示猪的生产成绩,β0表示常数项,βi (i=1,2,3,4,5)表示5个影响猪的生产成绩的回归系数,Xi (i=1,2,3,4,5)表示A,B,C,D,E这5组影响因素。
2)模型实现
先对变量组做以下处理:
对119个日平均温度取平均值
对119个日平均湿度取平均值
对17个周平均饲喂量取平均值
针对C组变量,由于三者有联系,在这里只考虑猪的肥瘦程度
对desease1,3,4,5取患病总数
对每个衡量指标进行归一化(即(x-min)/(max-min))
3)结果呈现
对仔猪总数的分析结果:
 
 

可见,对仔猪数目的影响程度从大到小依次为胎次、肥瘦程度、患病、湿度、温度。


对健康仔猪占的比例的结果分析:
    
可见,对健康仔猪比例的影响程度从大到小依次为肥瘦程度、湿度、胎次、温度、患病数。
4)结果分析
综合两者,影响猪的生产成绩程度最深的是猪的胎次,其次为猪的肥瘦程度、患病数,而温度和湿度对猪的影响不大。
       胎次之所以影响最大,是因为母猪的最佳生产期为5~6胎,超过6胎的不仅会影响到生产成绩,还会增加养殖成本,所以为了提高整个生产水平,应该尽可能的淘汰生产了8胎以上的母猪。
      猪的肥瘦程度也对生产成绩产生不可估量的影响,一旦母猪过度肥胖,脂肪过剩从而影响胎儿的正常发育,出现各种疾病,特别是圆环病,所以在母猪怀孕期间,控制好猪的饲喂量,进而控制母猪的体重,有利于保证猪的生产成绩。
      患病与否直接影响猪的生产性能和仔猪的健康状况,很明显患的疾病越多越严重,猪的生产成绩必定下降越厉害。

四、附录

matlab实现5种疾病、品种与肥瘦程度的相关性程度的代码

y=xlsread('数据.xlsx','肥瘦与患病','B2:B15001');  %%肥瘦程度
x=xlsread('数据.xlsx','肥瘦与患病','C2:C15001'); %%desease1
%x=xlsread('数据.xlsx','肥瘦与患病','D2:D15001'); %%desease2
%x=xlsread('数据.xlsx','肥瘦与患病','E2:E15001'); %%desease3
%x=xlsread('数据.xlsx','肥瘦与患病','F2:F15001'); %%desease4
%x=xlsread('数据.xlsx','肥瘦与患病','G2:G15001'); %%desease5
%x=xlsread('数据.xlsx','肥瘦与患病','I2:I15001');  %%品种
y=y';
x=x';
n=size(y,2);
a=sum(x==1 & y==1);
b=sum(x==1 & y==0);
c=sum(x==0 & y==1);
d=sum(x==0 & y==0);
k2=n*(a*d-b*c)^2/((a+b)*(c+d)*(a+c)*(b+d))

猜你喜欢

转载自blog.csdn.net/x_dmword/article/details/80531653