python爬虫的节点选择器无效

如下图：

在节点内

我想爬取href的数据，既/tjgb/20gx/36169.html
但是我代码写content_all = soup.find_all.table(class_="box") 时却什么也爬不下来，结果是个空列表。
请问应该怎么准确定位到包含href内容的那个节点呢？
网站的网址是 http://tjcn.org/tjgb/20gx/index.html
以下是我写的代码
import re
import requests
from bs4 import BeautifulSoup

for page in range(0,10):

url = f"http://www.tjcn.org/tjgb/20gx/index_{page}.html"

if page == 0:
    url = "http://www.tjcn.org/tjgb/20gx/index.html"
print(url)

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36"}

response = requests.get(url, headers=headers)
response.encoding = response.apparent_encoding
html = response.text

soup = BeautifulSoup(html, "lxml")

content_all = soup.find_all.table(class_="box")
print(content_all)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

芒果去核 2021-07-25 18:49

关注

改下定位操作就行了。


```python
import re
import requests
from bs4 import BeautifulSoup

for page in range(0,10):
    url = f"http://www.tjcn.org/tjgb/20gx/index_{page}.html"
    if page == 0:
        url = "http://www.tjcn.org/tjgb/20gx/index.html"
    #print(url)
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36"}
    response = requests.get(url, headers=headers)
    response.encoding = response.apparent_encoding
    html = response.text
    #print(html)
    soup = BeautifulSoup(html, "lxml")
    # content_all = soup.find_all.table(class_="box")
    # print(content_all)
    
    #定位到<ul>标签
    items = soup.find_all('ul')
    for li in items:
        #获取<a>标签下的href
        href = li.find('a').get('href')
        print(href)

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

python爬虫的节点选择器无效 python
2021-07-25 16:34

回答 3 已采纳改下定位操作就行了。 ```python import re import requests from bs4 import BeautifulSoup for page in range(0,1
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
python爬虫哪个选择器好用_Python爬虫之Selector选择器
2020-11-21 00:51

weixin_39670627的博客 XPath 语法XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。XML 实例文档我们将在下面的例子中使用这个 XML 文档。Harry Potter29.99Learning XML39.95...
python爬虫selenium点击按钮 python selenium 爬虫
2022-10-21 12:35

回答 2 已采纳可以看下xpath语法，还有个插件（xPath Finder）在firefox浏览器里可以一键定位到元素并复制xpath路径，如果插件给出的xpath路径定位不到，可以尝试自己写相对路径
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python爬虫，账号反爬怎么处理 python 爬虫
2021-09-08 19:39

回答 3 已采纳目前来看，账号反爬没有什么太好的应对措施。一旦你的账号确定被反爬了，就只能更换账号了，或者和网站客服沟通。对于账号反爬网站，一般来说，就是ip代理池和账号随机混用，还需要保证ip的质量，地域差异不要太
Python爬虫(5)css选择器
2022-08-28 16:33

演技拉满的白马的博客 CSS选择器伪类伪元素组合选择器 CSS实例
python爬虫的图片爬取 python 爬虫
2021-08-30 12:26

回答 2 已采纳按照下图这样就可以了
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
Python爬虫爬取不同网页的相似内容 python 爬虫
2022-03-11 17:52

回答 2 已采纳 re模块，正则表达式，split切分
python爬虫css选择器的使用
2021-10-11 17:13

一千次晚安。的博客 python爬虫之css选择器的使用 - Tron ' blog转自个人博客在 CSS 中，选择器是一种模式，用于选择需要添加样式的元素。 w3school给出的css选择器手册 .class demo： .intro 选择class为intro的标签 id demo： #...
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
Python爬虫实例（3）--BeautifulSoup的CSS选择器
2022-08-31 00:16

演技拉满的白马的博客 bs4 css选择器爬虫使用CSS选择器爬虫抓取小说章节目录
python 爬虫代码
2023-03-09 21:49

qq_繁华的博客 python 爬虫代码
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月25日

悬赏问题

¥15 公交车和无人机协同运输
¥15 stm32代码移植没反应
¥15 matlab基于pde算法图像修复，为什么只能对示例图像有效
¥100 连续两帧图像高速减法
¥15 组策略中的计算机配置策略无法下发
¥15 如何绘制动力学系统的相图
¥15 对接wps接口实现获取元数据
¥20 给自己本科IT专业毕业的妹m找个实习工作
¥15 用友U8：向一个无法连接的网络尝试了一个套接字操作，如何解决？
¥30 我的代码按理说完成了模型的搭建、训练、验证测试等工作(标签-网络|关键词-变化检测)

python爬虫的节点选择器无效

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新