scrapy爬虫如何爬取表格 td 中带有“rowspan”标签的内容？

我使用的是Scrapy爬虫，目前需要爬取的网页格式内容如下：

HTML代码如下：

除去标题外，一共是7行，即7个

标签，但实际上显示的表格只有5行数据，因为有2个tr数据是一样的，如第二个“华南”中用到了"rowspan=2"，那么第三个就没写了。

现在我需要的形式是，我的item[ ]每一次循环tr的时候，都能获取到五个数据（也就是第一个tr中的五个td内容），我的Item如下：

那么请问在已知外循环tr数量的情况下，我该如何遍历获取？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2017-07-16 02:28
关注
http://blog.csdn.net/loveaborn/article/details/16916559

解决
无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy爬虫注意事项
2019-12-30 11:11

月见空青的博客 scrapy爬虫注意事项 item数据只有最后一条 item字段传递后错误，混乱对一个页面要进行两种或多种不同的解析 xpath中contains的使用提取不在标签内的文本内容使用css、xpath提取倒数第n个标签提取表格信息(含...
Python爬虫实战：利用Selenium与BeautifulSoup高效提取表格数据
2025-07-18 15:51

Python爬虫项目的博客本文将详细介绍如何使用Python最新技术组合（Selenium+BeautifulSoup）高效提取网页表格数据。...传统的爬虫技术如纯Requests库已难以应对现代网页的复杂场景…（此处展开500字论述表格数据采集的挑战与机遇）
Python爬虫实战：高效爬取香港交易所(HKEX)数据的完整指南
2025-07-14 00:56

Python爬虫项目的博客文章涵盖现代爬虫技术的核心要点：异步IO处理、分布式爬取、验证码破解、数据可视化等高级主题，是金融数据采集的实用指南。关键词：Python爬虫、HKEX数据采集、异步爬虫、金融数据分析、反反爬策略。
零基础学会使用Python爬虫（以爬取省级行政区的全称数据为例）
2023-12-17 18:44

香菜大大大大王的博客零基础学会Python爬虫实验（以爬取省级行政区的全称为例）
python爬虫--自定义爬取网站数据并进行可视化分析
2019-03-22 14:40

weixin_43866709的博客今天写了一个爬虫，爬取了豆瓣网和腾讯网上一些信息，然后又用python自带的tkinter库制作了一个图形化界面，下面时代码和思路。思路 (1）为了用户更好的操作，先用pythonGUI编程设计出一个界面。（2）编写爬虫...
爬虫demo_十分钟带你从入门到进阶python爬虫
2020-12-16 19:14

weixin_39710106的博客十分钟带你从入门到进阶python爬虫01一、基础入门1.1什么是爬虫爬虫(spider，又网络爬虫)，是指向网站/网络发起请求，获取资源后分析并提取有用数据的程序。从技术层面来说就是通过程序模拟浏览器请求站点的行为，...
用 Python BeautifulSoup 实现网页表格数据的提取
2025-06-19 21:41

AI Python 编程的博客在当今信息爆炸的时代，网页上存在着大量有价值的数据。其中，表格数据是一种常见且结构化程度较高的数据形式，例如股票行情、商品价格列表、赛事比分等。本文章的目的就是教会读者如何使用 Python 的 BeautifulSoup...
Python网络爬虫基础
2022-08-08 09:54

巷子里的猫X的博客 python爬虫技术
Python爬虫实战：研究MarkupSafe库相关技术
2025-06-30 09:06

ylfhpy的博客文献 [1] 提出基于机器学习的智能爬虫框架，能够根据网页结构自动调整爬取策略，但在内容安全处理方面依赖传统的正则表达式过滤，存在一定局限性。国内研究主要集中在爬虫优化和安全防护算法改进方面，提出了一种...
第八十一篇：网络爬虫基础：HTML/CSS简介与XPath语法精讲
2025-12-21 09:10

yongche_shi的博客本文系统讲解了HTML/CSS基础和XPath语法，为网络爬虫开发提供核心...通过三者结合，可构建高效稳定的数据爬取方案，适用于数据分析、市场研究等场景。文章包含丰富的代码示例和图示，帮助开发者掌握网页解析核心技术。
没有解决我的问题, 去提问

scrapy爬虫如何爬取表格 td 中带有“rowspan”标签的内容？

1条回答 默认 最新

1条回答默认最新