手机
当前位置:查字典教程网 >脚本专栏 >python >利用Python抓取行政区划码的方法
利用Python抓取行政区划码的方法
摘要:前言国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。注意:抓取...

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*- ''' 获取国家统计局上的行政区划码 ''' import requests,re base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html' def get_xzqh(): html_data = requests.get(base_url).content pattern = re.compile('<p><span lang="EN-US">(d+)<span>.*?</span></span><span>(.*?)</span></p>') areas = re.findall(pattern,html_data) print "code,name,level" for area in areas: print area[0],area[1].decode('utf-8').replace(u'',''),area[1].decode('utf-8').count(u'') if __name__=='__main__': get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:Program FilesTencentQQI18N2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

【利用Python抓取行政区划码的方法】相关文章:

python中精确输出JSON浮点数的方法

用Python脚本生成Android SALT扰码的方法

Python列表推导式的使用方法

Python GAE、Django导出Excel的方法

Python编写检测数据库SA用户的方法

让python的Cookie.py模块支持冒号做key的方法

python 动态获取当前运行的类名和函数名的方法

python二叉树遍历的实现方法

python实现dnspod自动更新dns解析的方法

Python批量修改文件后缀的方法

精品推荐
分类导航