python中发送url请求但url地址中包括#怎么办

想要爬取新华日报上的新闻内容，遇到的问题是新华日报中的每一个新闻的网页地址是通过在最后使用井号加字符串标识得到的，如下，网页地址为“http://xh.xhby.net/pc/layout/202305/22/node_1.html井号content_1198084”
，但是通过python发送url请求时，井号后面的内容没有被识别，得到的网页内容仅仅是“http://xh.xhby.net/pc/layout/202305/22/node_1.html”。
即井号前面的整个内容，尝试过使用urllib.parse.quote等对其转义，又或是直接将井号变成%23这种编码，但是都没有用，想请问具体如何才能实现（使用python），（除了使用selenium模拟登录以外）。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
27-1994 2023-05-23 17:39
关注
对于这种后面通过井号加载的网页，使用 Python 中的 selenium 库来模拟浏览器访问网页，并获取通过井号加载的内容。

from selenium import webdriver # 创建浏览器对象 driver = webdriver.Chrome() # 访问网页 driver.get('http://xh.xhby.net/pc/layout/202305/22/node_1.html#content_1198084') # 等待一定时间，让页面加载完成 driver.implicitly_wait(10) # 获取通过井号加载的内容 content = driver.find_element_by_id('content_1198084').text # 打印内容 print(content) # 关闭浏览器对象 driver.quit()
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python 匹配url中是否存在IP地址的方法
2020-12-23 13:52

因为需要检测一个一个链接中是否包含了IP地址，在这里需要使用到正则表达式，python完美的支持了正则表达式，在这里使用re模块来完成，对正则表达式并不是很熟练，每次都是需要用的时候现查一下然后写一下，这里给...
解决Python发送Http请求时,中文乱码的问题
2020-09-16 22:50

这种方法主要是利用Python内置的`urllib.parse.quote()`函数来对URL中的特殊字符（包括中文）进行编码，确保传输过程中的正确性。 - `msg.encode('utf-8')`: 将字符串转换成UTF-8编码格式，解决中文乱码问题。 - `...
python通过urllib2获取带有中文参数url内容的方法
2020-09-22 08:44

将编码后的字符串插入到URL模板中，形成最终的请求URL： ```python api_url = '//www.jb51.net/q=%s'%content ``` 这里，`%s`是一个占位符，会被`content`变量的值替换。 4. **发送请求并获取内容**：最后，...
python发送HTTP请求的方法小结
2020-09-21 22:32

Python 作为一种广泛应用的编程语言，提供了多种方式来发送 HTTP 请求，包括 GET、HEAD 和 POST 方法等。下面我们将详细探讨这些方法及其在 Python 中的应用。 #### 一、GET 方法 GET 方法是最常见的 HTTP 请求...
解决python3 网络请求路径包含中文的问题
2020-09-20 12:14

在Python网络编程中，处理URL路径时经常会遇到包含中文字符的场景。在早期的Python 2中，开发者很少会注意到这个问题，因为在请求时，浏览器能自动处理URL中的中文字符，将其转换为URL编码。然而，在Python 3中，这...
python多线程批量访问url脚本
2020-10-26 15:11

Python是一种强大的编程语言，尤其在处理网络请求和数据操作方面表现突出。在处理大量URL访问时，使用单线程可能会导致效率低下，因为每个请求必须等待前一个请求完成才能进行。为了解决这个问题，我们可以利用...
在python中使用requests 模拟浏览器发送请求数据的方法
2020-12-24 07:27

如下所示： import requests\nurl='http://####' proxy={'http':'http://####:80'} headers={ "Accept":"text/html,application/...q=0.9,*/*;q=0.8", "Accept-Encoding": "gzip, deflate, br", ...q=0.8,en-US;... "Host
Python——发送HTTP请求
2024-10-28 08:00

IT·小灰灰的博客通过本文，我们学习了如何使用Python的aiohttp库...希望本文能够帮助你更好地理解和应用Python在网络编程领域的强大功能。记住，技术的力量是巨大的，但使用它时我们应该始终遵循道德和法律的约束。点我进群一起交流。
Python 简单运用URL请求库
2020-01-07 19:31

微软技术分享的博客爬虫是指编写程序来自动抓取互联网上的信息。在Python中，有一些常用的库可以帮助你实现爬虫功能。
python使用urllib2实现发送带cookie的请求
2020-12-24 16:41

本文实例讲述了python使用urllib2实现发送带cookie的请求。分享给大家供大家参考。具体实现方法如下： import urllib2 opener = urllib2.build_opener() opener.addheaders.append(('Cookie','cookiename=cookie...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月22日
展开全部

python中发送url请求但url地址中包括#怎么办

2条回答 默认 最新

问题事件

2条回答默认最新