「地图故事」中国县级以上行政区划地名中,哪些字是最常见的?
中国的县级以上行政区划地名共计3100多个,其中包括了县级行政区划的地名、市级行政区划的地名以及省级行政区划的地名。
通过统计地名中这些字出现的频率,最终发现出现概率最高的二十个字如下所示:
山 170
城 147
阳 126
江 122
安 117
南 111
东 82
平 80
宁 79
河 77
西 69
新 60
海 59
龙 51
川 46
兴 46
尔 44
水 44
大 43
武 42
出现概率最高的字是“山”,有没有想到?
“水”,“川”,“海”,“河”,“江”,也都出现在了其中,且总数达到了348个,超过了地名总数的十分之一,很震惊有木有?
“东”,“南”,“西”,“北”中,只有“北”字未出现,而"南"的出现概率最高。
“阳”也高居第三位,显示出了万物生长靠太阳的朴素真理。
“安”,“宁”,“兴”,’‘平’,说明了百姓对于生活的某些期盼,毕竟,平静的生活才是不错的生活,不错的生活就是每天都能睡个安稳觉。
那么,在这个榜单中,你又能领悟出什么独特的东西呢?
统计源码
代码使用Python 编写,请使用Python 2.7 运行。
#coding=utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
if __name__ == '__main__':
filepath=r'中国所有县级以上行政区划名称.txt'
f=open(unicode(filepath,'utf8'),'r')
line=str(f.read().replace("'","")).decode('GBK').encode('utf8')
citynames=line.split(',')
count=0
dictWord=dict()
for city in citynames:
city=city.replace('自治县','').replace('自治州','').replace('自治区','').replace('省','').replace('市','').replace('区','').replace('县','').replace('州','').replace('旗','').replace('族','')
for i in range(len(city)/3):
word=city[i*3:(i+1)*3]
if word not in dictWord:
dictWord[word]=0
dictWord[word]+=1
result=sorted(dictWord.items(),key=lambda item:item[1],reverse=True)
for x in range(20):
print result[x][0],result[x][1]
数据 & 代码下载
关注本站微信公众号,回复“资源下载”,获取验证码。
在微信里搜索“麻辣GIS”或微信扫描右侧二维码即可关注本站微信公众号。
投稿 & 作者简介
作者:盛光晓,精通arcpy
原文链接:https://blog.csdn.net/esa72ya/article/details/87885909
相关阅读
声明
1.本文所分享的所有需要用户下载使用的内容(包括但不限于软件、数据、图片)来自于网络或者麻辣GIS粉丝自行分享,版权归该下载资源的合法拥有者所有,如有侵权请第一时间联系本站删除。
2.下载内容仅限个人学习使用,请切勿用作商用等其他用途,否则后果自负。