1概述
聚类分析,Cluster analysis,亦称为群集分析,是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。在我们进行区域的分类时,有时会用到SPSS的聚类分析,然而在ArcGIS中,我们也可以直接进行聚类分析。
2实例
那我们以粤港澳大湾区为例,属性表里有收集的截至2018年的各地区GDP、人口、人均GDP,数据来自香港贸发局(https://research.hktdc.com/sc/article/MzYzMDE5NzQ5):
![](http://dingyue.ws.126.net/2021/0119/39968c6ep00qn6db5002gc000ht008dm.png)
![](http://dingyue.ws.126.net/2021/0119/d3b56dbep00qn6db5001uc000ht00c3m.png)
![](http://dingyue.ws.126.net/2021/0119/9fac13c1p00qn6db5002cc000ht00g5m.png)
如果我们想要以GDP为例将粤港澳大湾区分为三类,需要调出分组分析工具,在空间统计工具里(Spatial Statistics Tools)的聚类分布制图中的分组分析中(在不同的ArcGIS版本中处于不同的位置,此例为10·6版本):
![](http://dingyue.ws.126.net/2021/0119/d1b83fc3p00qn6db5004cc000a600kkm.png)
输入要素选择大湾区图层,唯一ID字段需要新建一个整型字段,长整型或者短整型都可以,赋予其不同的值,一般来说从1往后排序即可,组数选择3,分析字段选择人均GDP,空间约束条件选择no_spatial_constraint,意为只使用数据对要素分组,不需要要素之间有地理上的限制条件,初始化方法选择find_seed_locations,然后点击确定即可:
![](http://dingyue.ws.126.net/2021/0119/4a1a8ed2p00qn6db50017c000ht00cem.png)
3结果
那么我们可以看到,香港、澳门被单独分为一类,广州市、深圳市、佛山市、珠海市被分为一类,肇庆市、江门市、东莞市、中山市、惠州市被分为一类,这是比较符合我们认知的:
![](http://dingyue.ws.126.net/2021/0119/edbc7e85p00qn6db5001qc000ht009nm.png)
4小结
当然,我们也可以根据要求多选择一些字段一起进行聚类分析,只需要在分析字段中多勾选即可。
![](http://dingyue.ws.126.net/2021/0119/f35c2626p00qn6db5000cc000ht005km.png)
热门跟贴