麻辣GIS微信平台

更多 GIS 干货

微信关注不错过

「地图故事」中国县级以上行政区划地名中,哪些字是最常见的?

中国的县级以上行政区划地名共计3100多个,其中包括了县级行政区划的地名、市级行政区划的地名以及省级行政区划的地名。

通过统计地名中这些字出现的频率,最终发现出现概率最高的二十个字如下所示:

山 170
城 147
阳 126
江 122
安 117
南 111
东 82
平 80
宁 79
河 77
西 69
新 60
海 59
龙 51
川 46
兴 46
尔 44
水 44
大 43
武 42

出现概率最高的字是“山”,有没有想到?

“水”,“川”,“海”,“河”,“江”,也都出现在了其中,且总数达到了348个,超过了地名总数的十分之一,很震惊有木有?

“东”,“南”,“西”,“北”中,只有“北”字未出现,而"南"的出现概率最高。

“阳”也高居第三位,显示出了万物生长靠太阳的朴素真理。

“安”,“宁”,“兴”,’‘平’,说明了百姓对于生活的某些期盼,毕竟,平静的生活才是不错的生活,不错的生活就是每天都能睡个安稳觉。

那么,在这个榜单中,你又能领悟出什么独特的东西呢?

统计源码

代码使用Python 编写,请使用Python 2.7 运行。

#coding=utf-8

import sys
reload(sys)
sys.setdefaultencoding('utf8')

if __name__ == '__main__':
    filepath=r'中国所有县级以上行政区划名称.txt'
    f=open(unicode(filepath,'utf8'),'r')
    line=str(f.read().replace("'","")).decode('GBK').encode('utf8')
    citynames=line.split(',')

    count=0

    dictWord=dict()

    for city in citynames:
        city=city.replace('自治县','').replace('自治州','').replace('自治区','').replace('省','').replace('市','').replace('区','').replace('县','').replace('州','').replace('旗','').replace('族','')
        for i in range(len(city)/3):
            word=city[i*3:(i+1)*3]
            if word not in dictWord:
                dictWord[word]=0
            dictWord[word]+=1

    result=sorted(dictWord.items(),key=lambda item:item[1],reverse=True)

    for x in range(20):
        print result[x][0],result[x][1]

数据 & 代码下载

麻辣GIS为了防止资源恶意爬取导致被和谐,此处内容被作者隐藏。
验证码:

关注本站微信公众号,回复“资源下载”,获取验证码。

在微信里搜索“麻辣GIS”或微信扫描右侧二维码即可关注本站微信公众号。

投稿 & 作者简介

作者:盛光晓,精通arcpy

原文链接:https://blog.csdn.net/esa72ya/article/details/87885909

相关阅读

麻辣GIS-Sailor

作者:

GIS爱好者,学GIS,更爱玩GIS。

声明

1.本文所分享的所有需要用户下载使用的内容(包括但不限于软件、数据、图片)来自于网络或者麻辣GIS粉丝自行分享,版权归该下载资源的合法拥有者所有,如有侵权请第一时间联系本站删除。

2.下载内容仅限个人学习使用,请切勿用作商用等其他用途,否则后果自负。

手机阅读
公众号关注
知识星球
手机阅读
麻辣GIS微信公众号关注
最新GIS干货
关注麻辣GIS知识星球
私享圈子

留言板(小编看到第一时间回复)