在数据清洗中,分段赋值是一种常用的技术,它允许我们根据特定条件对数据集中的字段进行区间赋值,从而生成新的字段。以下是一些具体的步骤和方法,用于在数据清洗过程中进行分段赋值(以数据清洗数据集为例):

1、进入析易数据分析平台

2、在最左侧数据栏中找到分段赋值功能:常用功能→分段赋值

打开网易新闻 查看精彩图片

3、选择数据清洗数据集

打开网易新闻 查看精彩图片

4、选择血红蛋白含量一列数据(对血红蛋白含量进行分段赋值)

打开网易新闻 查看精彩图片

5、设置分段条件:血红蛋白含量<113,内容赋值为高血红蛋白;血红蛋白含量>113,内容赋值为低血红蛋白

打开网易新闻 查看精彩图片

6、点击替换,生成一列新增字段数据,记录赋值结果

打开网易新闻 查看精彩图片