文章摘取:李曼养猪大会

1、提出问题

如何根据后备猪初选数据中各项特征值,准确快速识别猪只是否选育?

2、理解数据

查看数据(Look at the Data)

1、Choice of retention age:选留日龄

2、Primary weight:初生重

3、Class:是否选留(1:选留;0:不选留)

4、Birth order:胎次

5、Generation Interval:世代间隔

6、SPI:母猪生产力指数

7、TSI:终端父系指数

8、MLI:母系指数

9、NBA:产仔数

10、W2E:断奶到再发情的间隔

11、LWT:断 奶 窝 重

12、DAYS:达到目标体重日龄

13、BF:背膘厚

14、PCL:胴体瘦肉率

数据的可视化:

3、数据预处理

特征标准化

用SMOTE模型进行采样(消除数据不均衡的影响)

获取训练数据及测试数据作

4、构建模型

逻辑回归模型构建

随机森林模型构建