基于GIS的榆林市乡镇地名分布特征研究|gis|东南|地域|地理|榆林市|行政区划

江西地名研究

关注我们，获取更多地名资讯

摘要：利用不同的网络公开地名数据源进行数据融合，获得榆林市乡镇级居民地地名数据，在此基础上，对地名数据进行统计分类，引入地名密度和地名点距离的指标，运用GIS的分析方法，对榆林市乡镇级地名数据进行景观分析。研究得出：榆林乡镇地名从东南向西北部递减，并且呈现出聚集的分布特征；榆林市的自然人文特征直接体现在其主要地名分类的分布上，山水类地名的分布反映了榆林西北部沙漠干旱，东南部黄土丘陵、河流较密的自然特点，姓氏、军事类地名的分布则反映了榆林市的移民文化、多民族混居的民族特色，以及古代军事价值高的特点。

关键词：网络数据源；地名点密度；地名点距离；地名分类

引言

地名不仅是某一区域的地理称谓，更代表着该地域的自然、人文特点。分析该区域地名的位置、含义、变迁等,可以获得相关的社会、文化、历史、地理、“人地关系”等信息。我国地名学的研究曾长期使用定性的研究方法,即着重于地名的来源、含义及分类，定量分析的研究则较少。目前，随着GIS在各行各业的应用，运用GIS中空间分析的方法来研究地名的分布规律已经成为地名研究领域的热点和趋势。运用GIS方法进行地名的定量数理分析研究，可以补充定性描述的不足，更精确、更形象地表示地名现象的分布规律，帮助人们透彻地理解地名的发展与分布，也更有说服力。国外学者王法辉着重分析了壮语地名的分布状况并探究影响壮语地名分布的多种因素等。国内也有一些相关研究，董晓晓利用ArcGIS空间分析软件，将《中国地名录》（1983年）的地名数据录入软件中成图，比较现有的气候、水系、人口数据，得出一些地名分布的规律；陈晨运用GIS核密度估计法详细地分析了北京市地名景观分布特征及成因；还有一些学者做了不同地域的基于GIS的地名景观分析。这些研究进行了很多有益的探索，但是也存在一定的问题：1）这些地名研究所用到的数据来源不同，有从地图上人工统计的，也有实地定点测量的，这样数据的获取耗时耗力，且增加了数据出现错误的可能性，降低了研究的可信度。2）他们仅仅是应用了统计的方法来计算各类地名在总地名中的比例，或者是用核密度或标准椭圆的方法来描述地名的分布特征,而用这些指标来描述地名点的分布规律是不全面、不深入的。

在本文中，将利用网络上出现的OSM、GeoNames、GNS三种公开地名数据来解决数据源问题，用地名点密度与地名点距离来更具体地表示地名的分布规律。

研究区概况

榆林位于陕西省最北部，地处陕甘宁蒙晋五省交界接壤地带，东临黄河与山西相望，西连宁夏、甘肃，北邻内蒙，南接陕酉延安市。由于地处毛乌素沙漠南缘和黄土高原过渡地带，地势西北高、东南低，地貌以长城为界，北部为风沙草滩区，南部为黄土丘陵沟壑区。区内主要山脉有横山、白于山，主要河流有黄河、无定河、窟野河、秃野河、佳芦河等。陕北高原黄土分布广泛，具有典型的塬、梁、峁等地形，是我国水土流失最严重的地区之一。

数据来源与研究方法

2.1公开地名数据源介绍及对比

随着地理信息数据服务的发展，网络上出现了一些在格式、尺度、范围、内容、侧重点等多方面具有差异性的开源地名数据，典型代表有:GeoNames、GNS、OSM，这些地名数据公开下载,易获取，可信度也较高。

1） GeoNames

GeoNames是一个免费的全球地理数据库。数据收集自（美国）国家测绘机构、国家统计署、国家邮政局，还有美国陆军。它包含了650万个地点将近200种语言的850万个地名和200万种别名，并且允许用户纠正数据和添加新的地名。数据每日更新一次。下载地址：www.geonames.org；文件类型:TXT。有A（行政区划）、H（水文）、L（土地利用）、R（交通管线）、S（附属设施）、T（地貌）、V（植被）、U（海面下）、P（居民地）等9大类645种二级分类。数据属性内容包括Name、AsciiName、Altema-tiveName、FeatureClass、FeatureCode、CC1、CC2、ADM1、ADM2、ADM3、ADM4、TimeZone、DEM、Elevationo。

2） GNS

GNS是一个涵盖美国本土以外地区的全球性地名数据库，数据来源于美国国家地理情报局（NGA）和地名委员会（BGN）,最低每周更新一次，它的分类标准和GeoNames相同，分为9大类645个二级类。数据属性内容包括RC、Lat、Lon、FullName、FuHNameEN、FC、DSG、CC1、CC2、ADM1、ModifiedTime、NT、ShortForm、Generic、LC、MGRS等。数据格式TXT。GNS数据提供ftp下载，下载网址:ftp://ftp.nga.mil/pub2/gns-data；GNS库包含全球500万个要素900多万个名称。GNS地名库采用WGS84坐标。

3） OSM

OpenStreetmap（OSM,网址：http://www.openstreet-map.org/）严格来说不仅仅是一个地名数据库，而是一个开放的免费网络地图。OSM是一个网上地图协作计划，任何注册用户都可以上传、编辑自己熟悉的区域数据，每天更新一次。所以，同上两种公开地名数据源相比,OSM数据内容丰富。OSM提供多种格式的数据，包括Shapefile格式。有边界（Boundary）、地貌（Natural）、铁路（Rail-way）、高速公路（Highway）、地名（Places）等共26类。

4） 3种数据源对比

对于以上3种数据源，不同区域、不同种类的地名数据都有差异，同时它们各有优势，GeoNames按地区提供数据，更新频率高，数据来源可靠，GNS提供各类别及汇总的地名数据，可靠性高；OSM数据内容、数据格式丰富，但由于数据是由用户自己上传共享，数据的可靠性相对较差。具体到榆林市的乡镇居民地地名，GeoNames、GNS、OSM有以下差异（见表1）。

2.2研究方法

本文依次应用数据融合方法进行地名数据处理得到目标地名数据，应用ArcGIS中的核密度分析与K函数分析在地名点密度和地名点距离的指标上体现地名的分布特征，最后通过地名分类统计与可视化的方法表现出不同类的地名点分布特征。在这里，着重介绍K函数分析。

Ripley's K函数（多距离空间分析函数）是一种分析事件点数据的空间模式的方法。该方法对一定距离范围内的空间相关性（要素聚类或要素扩散）进行汇总，计算与每个要素关联的相邻要素的平均数量;相邻要素是指小于计算距离的要素。随着计算距离的增大，各要素所具有的相邻要素数通常会越多。如果某个特定计算距离的平均相邻要素数高于/大于整个研究区域内要素的平均密度，该距离的分布方式将被视为聚类分布;反之为离散分布。在实际应用中，通常选用K函数的变种函数L（d）函数来计算，公式如下。

式中，A表示区域，N表示点数，d表示距离，k(i，j）表示权重。如果特定距离的K观测值（即L（d））大于K预期值，则与该距离（分析尺度）的随机分布相比，该分布的聚类程度更高。如果K观测值（即L（d））小于K预期值，则与该距离的随机分布相比，该分布的离散程度更高。如果K观测值大于HiConfEnv值，则该距离的空间聚类具有统计显著性;如果K观测值小于LwConfEnv值，则该距离的空间离散具有统计显著性。

结果与分析

3.1数据融合结果分析

统一数据格式（Shapefile格式数据）、数据属性内容（经、纬度属性、地名属性、地名分类属性）、数据翻译之后，可以得到目标地名数据，即榆林地区乡镇级地名数据。具体来讲，根据2012年民政部公布的榆林地区乡镇级行政区划，榆林地区共有12个县区176个乡镇，我们对3种数据源经过处理得到的数据中共有166个乡镇，也就是说10个乡镇数据缺失，占总乡镇数目的5.6%。可以看出通过网络公开数据源获得的地名数据是比较齐全完整的，这为今后进行地名研究探索了一条可靠的数据来源途径。具体结果见表2。

3.2地名点空间分布特征

众所周知，点的分布特征是有一阶特性和二阶特性的，一阶特性是指点的数量，用点密度来表示；二阶特性是指点之间的吸引力，用点距离来表示。所以，仅仅用点密度这一指标来表示地名点的分布特征是不全面的，如图1所示。

在点密度相同的情况下，点分布却有着聚集和离散两种不同模式。所以，我们要通过点密度来回答地名点的地区分布差异问题，用点距离来回答地名点之间的吸引力问题，即地名点是相互吸引聚集还是相互排斥离散的问题。

3.2.1 地名点密度特征

不同地区地名点的分布是有多少差异的，这里用核密度来体现这一差异。核密度分析用于计算表示每个输出栅格像元周围的点要素的密度。每个点上方均覆盖着一个平滑曲面，在点所在位置处表面值最高，随着与点的距离的增大表面值逐渐减小，在与点的距离等于捜索半径的位置处表面值为零。每个输出栅格像元的密度均为叠加在栅格像元中心的所有核表面的值之和。通过榆林地区乡镇级居民点分布核密度可以看出，乡镇居民点的密度从东南到西北依次递减，在一定程度上反映了榆林市东南部人口相对密集、西北部人口稀疏的人口分布特点，这也与榆林市西北部沙漠干旱少雨不适宜居住、东南部丘陵河流较密集适宜居住的自然特点相吻合。

3.2.2 地名点距离特征

对于榆林地区乡镇级居民点呈现何种分布模式，属于聚集、离散、随机中的哪一种，我们主要用ArcGIS中的L（d）函数（即不同距离上的K函数）来计算、回答这一问题。

对于榆林市乡镇居民点距离，我们采用L（d）函数来计算，在10个距离段上进行计算，并设置置信区间为99.9%，得到结果，如图2所示。

由图2可知K的观测值大于预期值并且超出置信区间，说明榆林市乡镇居民点的空间聚类具有统计显著性，说明居民点之间是相互吸引的，且是聚集的。而这可能是由于自然环境比较恶劣，宜居住的地域有限，容易吸引更多的人类聚集居住。

3.3地名分类统计及地理学分析

3.3.1 地名分类统计

根据地名的相关知识，把地名分为自然环境要素相关地名和人文环境要素相关地名两大类，其中，自然环境要素相关地名再细分类为与地形地貌相关，与水文、动植物相关等类型，人文环境要素相关地名可分为与民族相关、姓氏相关、经济军事相关等。通过对榆林市乡镇级地名的整理分类，将其共划分为12类：山、水、植物、方向、数字、颜色、姓氏、建筑、经济、军事、民族、愿望，见表3。

其中，与自然要素相关的地名有129个，以反映地形地貌特征的山、水类地名数量最多。水类地名共有54个，占地名总数的32.5%，其中含有“湾”字的11个，“沟”字的10个，“河”字的10个。山类地名共42个，占地名总数的25.3%，其中含有“岔”字的8个，“川”字的7个，“梁”字的5个。其余主要自然要素地名分类中，与动植物相关的地名有19个，指示方向的地名有8个。

与人文要素相关的地名共86个，以姓氏和建筑类最多。姓氏相关地名共计38个，占地名总数的22.8%，各姓氏数量平均。建筑类地名共计16个，占地名总数的9.6%，含有“塔”字的4个。其余主要人文要素地名中与经济相关的地名9个，军事相关的地名10个，愿望相关的地名7个。

3.3.2 地名的自然环境体现

从上面统计结果看，榆林地区乡镇级居民地自然要素地名中山水类地名占比最高，水类地名整体上在榆林南部分布较多，河流密集的地区水类地名也就越密；山类地名基本上分布在长城以南，且以“岔”“梁”“川”“塬”为主。这些都反映了榆林市北部干旱少雨，南部黄土丘陵，河网密集的地貌地形特点。

由此可见，特定地域的自然环境特点直接体现在其主要自然地名类的分布特征上，地名景观特征是区域自然环境的记录和表达。

3.3.3 地名的人文环境体现

1）移民文化的体现

在榆林市乡镇地名中，有关姓氏的地名有38个，涉及28个姓氏。一个地级市有这么多有关姓氏的乡镇在全国并不多见，而这与榆林的历史有关。榆林历史久远，从夏商时就有记载，其地理位置特殊，是大漠通往内地的交通要道之一，军事地位十分重要，素有“九边锁钥”“雄镇三秦”之说，是兵家必争之地。所以，每一次中原王朝和北方游牧民族都会在这里展开激烈的争夺，反复易帜，经常出现人口的迁移与融合的情况，这就造成了多姓氏聚落的出现。同时也有一些带有民族特色的地名，如巴拉素镇，巴拉素是蒙语，指黄色的水。

2）军事文化的体现

由于榆林的军事地理位置重要，历史上在此发生过多次的战争，所以，也遗留下来一些带有军事色彩的地名。有“寨”“堡”“驿”“武”“靖”等，其中带“堡”字的地名有5个，此类地名基本沿长城一线展开，整体面向西北布局，反映出当时的主要威胁来自于西北方向，体现了当时的戍边文化。

结束语

本文从公开地名数据源入手，通过数据融合得到目标地名数据，利用分类统计方法和ArcGIS软件，分析了榆林市乡镇级地名的类型、分布特点及其背后的地理人文体现，得到如下结论:

1）对GeoNames、GNS、OSM三种公开地名数据源进行数据融合，得到目标地名数据，是解决地名研究中数据源不易获取问题的有效途径。

2）榆林市乡镇地名的空间分布具有区域不平衡性，东南部地名多，西北部地名少，并且地名呈现聚集的分布模式。

3）在榆林市乡镇地名的类型中，山水、姓氏、建筑类的地名占比较高，其中，水类地名整体上在榆林南部分布较多，河流密集的地区水类地名也就越密；山类地名基本上分布在长城以南，且以“岔”“梁”“川”“塬”为主。这些都反映了榆林市北部干旱少雨，南部黄土丘陵，河网密集的地貌地形特点。28个姓氏类地名和带有军事色彩的建筑类地名反映出了榆林市在历史上是一个军事价值重要、人口流动频繁的地区。

作者：李勋马金辉

来源：《测绘与空间地理信息》2017第3期

选稿：黎淑琪

编辑：黄海红

校对：汪依婷

审订：邹怡思

责编：甄艺涵

微信扫码加入

中国地名研究交流群

QQ扫码加入

江西地名研究交流群

欢迎来稿！欢迎交流！