Python爬虫新闻网站的标题返回结果为空列表

Python爬虫新闻网站的标题，使用BeautifulSoup，但返回结果为空列表（网站为https://www.dongqiudi.com/articles）
检查了父子节点的顺序，并没有出错，但就是返回为空
结果如图

import requests
from bs4 import BeautifulSoup

URL='https://www.dongqiudi.com/articles'
Headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0'
}
response = requests.get(url=URL,headers=Headers)
response.encoding = 'utf-8'
html_source = response.text

soup = BeautifulSoup(html_source, 'html.parser')
li_list = soup.select('body > div.news-list > div.news-list-con > div.top > div.top-right > a')
print(li_list)

网站源代码（部分）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2024-05-10 00:58
关注
去掉bs4选择器中的'body >'即可

li_list = soup.select('div.news-list > div.news-list-con > div.top > div.top-right > a')
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 4
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python爬虫xpath解析返回为空有什么解决方法吗 python 爬虫
2021-12-10 11:12

回答 1 已采纳为空的地方xpath主要是为了拿到什么数据，贴一下网页和要拿到的数据，帮你写一下xpath。上面图上的xpath那么长那么绝对路径，大概率拿不到数据的。
Python爬虫 xpath 列表为空 python 有问必答爬虫
2022-03-08 08:32

回答 2 已采纳第二个li的div下少了结束标签导致etree解析出错了少了div结束标签后，etree将建筑类别后的几点全部归类到第二li下了，改下面这样就可以了 import requests from lxm
Python爬虫 | 爬取环境新闻实战
2023-12-26 13:41

程序员晓晓的博客 ,第二页的url“http://hbj.wuhan.gov.cn/hjxw/index_1.shtml”为那么之后第N页的url为在后面加上_ {i}，即为“http://hbj.wuhan.gov.cn/hjxw/index_{i}.shtml”Python所有方向的技术点做的整理，形成各个领域的知识...
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
python爬虫返回的html文件打开网页是空的 python
2022-06-15 23:07

回答 1 已采纳很正常，一个网页能运行，不但需要html文件，还需要css和js文件在背后支撑。（前端和后端）你只是爬下来了一个html文件，自然什么都不会展示出来。你仔细想想，如果这么轻易的就能被你爬到百度的htm
python 爬虫 post请求返回的数据不全，和postman模拟的不一样，关键内容是个空列表 python 有问必答爬虫
2021-09-08 11:50

回答 2 已采纳经过实际测试，该站对 refer和 origin 没有验证，却验证了 content-type，你在header里加上content-type就可以了 import requests impor
Python编程基础 Python语言程序教程 Python基础入门教程共131页.pptx
2024-06-22 20:02

Python的设计哲学强调代码的可读性和简洁的语法，这也使得Python成为一门易于学习且功能强大的编程语言。 - **简介**: Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。通过Python，可以更快速地...
爬虫一直遇到返回空表格的问题 python 爬虫
2022-03-12 23:06

回答 1 已采纳如果你确定soup没问题的话，那就是你的soup.find_all那里出了问题，你可以单独打印一下看看，应该是你写的条件没有匹配到
python爬虫爬取京东评论返回空白的求助贴 python
2021-02-17 18:23

回答 3 已采纳在header参数中添加referer默认值，应该是直接访问触发反爬了
python爬虫使用json()方法将response结果转化为JSON格式时报错 json python 爬虫
2022-02-11 13:01

回答 4 已采纳网站设计了相应的反扒策略，需要把Cookie添加到headers中，这种问题一般从headers入手，有的限制User-Agent必须有，有的限制Cookie headers = { 'Cooki
python爬虫-18-列表增加数据之append.ev4.rar
2023-09-25 23:00

例如，假设我们正在爬取一个网站上的文章标题，我们可以创建一个空列表来存储这些标题，然后每次获取一个标题时，就使用`append()`将其添加到列表中： ```python titles = [] title = get_title_from_webpage() # ...
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。我们希望通过爬虫程序获取豆瓣电影的名称、评分和简介等信息，以便进行数据分析或制作推荐系统。
Python爬虫入门教程（详细教程篇），爬虫Python入门
2024-08-20 14:41

Python_trys的博客自面世以后，Python 深受广大开发者的喜迎，在网站开发，网络爬虫，数据分析，机器学习，人工智能等领域都有其过人之处。在“Python基础教程“中，本人将会从各个不同领域介绍Python的用法，今天就先从最常用的网络...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月9日

悬赏问题

¥300 寻抓云闪付tn组成网页付款链接
¥15 请问Ubuntu要怎么安装chrome呀？
¥15 视频编码十六进制问题
¥15 Xsheii7我安装这个文件的时候跳出来另一个文件已锁定文件的无一部分进程无法访问。这个该怎么解决
¥15 unity terrain打包后地形错位，跟建筑不在同一个位置，怎么办
¥15 FileNotFoundError 解决方案
¥15 uniapp实现如下图的图表功能
¥15 u-subsection如何修改相邻两个节点样式
¥30 vs2010开发 WFP（windows filtering platform）
¥15 服务端控制goose报文控制块的发布问题

Python爬虫新闻网站的标题返回结果为空列表

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新