python获取行政区划代码，输出的文件爬取内容为空

需求，获取行政区划代码，编写如下代码，输出的文档内容为空，这是为什么？


# -*-coding:utf-8-*-
import requests
from bs4 import BeautifulSoup

# 根据地址获取页面内容，并返回BeautifulSoup
def get_html(url):
    # 若页面打开失败，则无限重试，没有后退可言
    while True:
        try:
            # 超时时间为1秒
            response = requests.get(url, timeout=1)
            response.encoding = "GBK"
            if response.status_code == 200:
                return BeautifulSoup(response.text, "lxml")
            else:
                continue
        except Exception:
            continue


# 获取地址前缀（用于相对地址）
def get_prefix(url):
    return url[0:url.rindex("/") + 1]


# 递归抓取下一页面
def spider_next(url, lev):
    if lev == 2:
        spider_class = "city"
    elif lev == 3:
        spider_class = "county"
    elif lev == 4:
        spider_class = "town"
    else:
        spider_class = "village"

    for item in get_html(url).select("tr." + spider_class + "tr"):
        item_td = item.select("td")
        item_td_code = item_td[0].select_one("a")
        item_td_name = item_td[1].select_one("a")
        if item_td_code is None:
            item_href = None
            item_code = item_td[0].text
            item_name = item_td[1].text
            if lev == 5:
                item_name = item_td[2].text
        else:
            item_href = item_td_code.get("href")
            item_code = item_td_code.text
            item_name = item_td_name.text
        # 输出：级别、区划代码、名称
        content2 = str(lev) + "\t" + item_code + "\t" + item_name
        print(content2)
        f.write(content2 + "\n")
        if item_href is not None:
            spider_next(get_prefix(url) + item_href, lev + 1)


# 入口
if __name__ == '__main__':

    # 抓取省份页面
    province_url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/index.html"
    province_list = get_html(province_url).select('tr.provincetr a')

    # 数据写入到当前文件夹下 area-number-2020.txt 中
    f = open("area-number-2020.txt", "w", encoding="utf-8")
    try:
        for province in province_list:
            href = province.get("href")
            province_code = href[0: 2] + "0000000000"
            province_name = province.text
            # 输出：级别、区划代码、名称
            content = "1\t" + province_code + "\t" + province_name
            print(content)
            f.write(content + "\n")
            spider_next(get_prefix(province_url) + href, 2)
    finally:
        f.close()

输出的文档截图如下：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-09-23 21:45
关注
我执行你的代码是没问题的，你把运行过程截图我看下，应该没问题，重新运行试试

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python程序获取最新的行政区划名称代码
2023-06-20 07:18

阳光宅男xxb的博客 python程序获取官方最新发布的全国县以上行政区划名称代码（附最终解析到的json、csv/excel 格式的行政区划数据）
2009-2023年全国统计用区划代码区县代码及名称爬取 - Python爬虫
2024-09-28 17:15

2009年至2023年全国统计用区划代码区县代码及名称爬取项目是针对中国各级行政区划代码和名称数据进行收集和整理的工程，主要采用Python编程语言完成。该项目涵盖的年份从2009年开始，一直持续到2023年，说明了其历时...
Python爬取全国行政区划数据实战：从入门到精通
2025-07-16 14:55

Python爬虫项目的博客本文将详细介绍如何使用Python爬虫技术获取最新的全国行政区划数据，包括省、市、县、乡/镇四级数据。本文详细介绍了如何使用Python爬取全国行政区划数据，从基础的同步爬虫到高性能的异步爬虫，再到各种高级功能的...
获取全国行政区划数据
2025-06-15 13:39

胡斌附体的博客开始认为在网站上可以直接下载到区划编码的json格式数据。但是找到了能够查询的国家民政局网站，提供了截至到5月份最新的数据。...需要配置远程接口获取区划数据。，进入网站后点击菜单栏民政数据就可以看到。
零基础学会使用Python爬虫（以爬取省级行政区的全称数据为例）
2023-12-17 18:44

香菜大大大大王的博客零基础学会Python爬虫实验（以爬取省级行政区的全称为例）
Python 爬虫实战：2025年最新全国行政区划代码抓取
2025-12-15 09:18

小庄-Python办公的博客 Python爬虫实战：2025年全国行政区划代码抓取本文介绍一个Python爬虫项目，用于抓取2025年全国行政区划代码数据。项目采用requests库发送HTTP请求，通过正则表达式解析网页内容，最终将数据保存为CSV和JSON格式。 ...
Python获取省市县行政区划代码
2023-02-21 14:01

FORGIVEN_H的博客 Python获取省市县行政区划代码
零基础掌握百度地图兴趣点获取POI爬虫（python语言爬取）（基础篇）
2017-12-07 21:30

才华横溢吴道简的博客先进入基础篇，本篇主要讲原理方面，并实现步骤分解，为python代码编写打基础。因为是0基础开始，所以讲得会比较详细。如实现目的所讲，爬取昆明市全部中学数据，就是获取百度地图上昆明市范围内所有关键字带...
上海行政区划经纬度地图_爬取高德地图POI数据，GIS空间分析及可视化
2021-01-09 18:34

weixin_30871011的博客之前和大家介绍了一些爬虫的基础知识，现在，让我们继续这一话题，今天如预期的一样，给大家介绍介绍如何爬取高德地图的POI，做一个简单的GIS空间分析，并进行可视化。关于gis制图之前很少实践过，如有不规范的地方...
python爬取地图地址_Python爬取百度地图poi数据 !
2020-12-13 09:18

weixin_39653320的博客今天给大家分享python爬取百度地图小区的数据，希望大家看后，可以尝试自己编写爬取自己所在市的中学，公园，银行，地铁站，等等的poi数据。实验目的：爬取合肥市范围内所有小区的数据，包括名称和经纬度坐标。步骤...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月23日

python获取行政区划代码，输出的文件爬取内容为空

1条回答 默认 最新

问题事件

1条回答默认最新