「地图故事」中国县级以上行政区划地名中,哪些字是最常见的?

中国的县级以上行政区划地名共计3100多个,其中包括了县级行政区划的地名、市级行政区划的地名以及省级行政区划的地名。

通过统计地名中这些字出现的频率,最终发现出现概率最高的二十个字如下所示:

山 170
城 147
阳 126
江 122
安 117
南 111
东 82
平 80
宁 79
河 77
西 69
新 60
海 59
龙 51
川 46
兴 46
尔 44
水 44
大 43
武 42

出现概率最高的字是“山”,有没有想到?

“水”,“川”,“海”,“河”,“江”,也都出现在了其中,且总数达到了348个,超过了地名总数的十分之一,很震惊有木有?

“东”,“南”,“西”,“北”中,只有“北”字未出现,而"南"的出现概率最高。

“阳”也高居第三位,显示出了万物生长靠太阳的朴素真理。

“安”,“宁”,“兴”,’‘平’,说明了百姓对于生活的某些期盼,毕竟,平静的生活才是不错的生活,不错的生活就是每天都能睡个安稳觉。

那么,在这个榜单中,你又能领悟出什么独特的东西呢?

统计源码

代码使用Python 编写,请使用Python 2.7 运行。

#coding=utf-8

import sys
reload(sys)
sys.setdefaultencoding('utf8')

if __name__ == '__main__':
    filepath=r'中国所有县级以上行政区划名称.txt'
    f=open(unicode(filepath,'utf8'),'r')
    line=str(f.read().replace("'","")).decode('GBK').encode('utf8')
    citynames=line.split(',')

    count=0

    dictWord=dict()

    for city in citynames:
        city=city.replace('自治县','').replace('自治州','').replace('自治区','').replace('省','').replace('市','').replace('区','').replace('县','').replace('州','').replace('旗','').replace('族','')
        for i in range(len(city)/3):
            word=city[i*3:(i+1)*3]
            if word not in dictWord:
                dictWord[word]=0
            dictWord[word]+=1

    result=sorted(dictWord.items(),key=lambda item:item[1],reverse=True)

    for x in range(20):
        print result[x][0],result[x][1]

数据 & 代码下载

麻辣GIS 此处内容已经被作者隐藏,请输入验证码查看内容
验证码:
关注本站微信公众号,回复“资源下载”,获取验证码。在微信里搜索“麻辣GIS”或微信扫描右侧二维码即可关注本站微信公众号。

投稿 & 作者简介

作者:盛光晓,精通arcpy

原文链接:https://blog.csdn.net/esa72ya/article/details/87885909

没有下文
如果本文对您有所帮助,恳请您对我们团队进行打赏捐助, 让我们在传播3S的路上可以走得更远,不胜感激。 PS:如果你是学生党,请优先把经费用于购买学习资料 以及 与小哥哥/小姐姐约会上:-)
赞赏支持
微信捐助麻辣GIS
微信打赏
支付宝捐助麻辣GIS
支付宝打赏

麻辣GIS-Sailor
作者:
GIS爱好者,学GIS,更爱玩GIS。

如您有疑问,可在文末留言,或到QQ群中提问。

本站QQ群(一):291616564 麻辣GIS

本站QQ群(二):166408035 麻辣GIS(二)

本站QQ群(三):627853279 麻辣GIS(三)

本站QQ群(四):436386604 麻辣GIS(四)

微信公众号:malagis,扫描右边二维码直接关注。

发表评论