爬取不到超链接是什么问题呢?

爬取小说的时候
url = 'http://www.youxinyuedu.com/main_book.html?webid=6eeda3ca427b4e80efd09c0cbd1e3188%27
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'}
response = requests.get(url,headers=headers).content.decode('utf-8',errors='ignore')
soup = BeautifulSoup(response,"html.parser")#文件解析
chapters = soup.find("div",class_="line").text#筛选目标
print(chapters)

结果：
第1节

第2节

第3节

第4节

第5节

为啥取不到里面超链接呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ShowMeAI 2022-12-04 16:32
关注
我看了一下对应的小说网站，你用soup.find("div",class_="line").text获取的确实是第几章的文本，你要获取链接的话，是要获取href的值。

chapters_link = soup.find("div",class_="line").get('href')
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Edge浏览器点击超链接后如何跳回？ edge webpack 前端
2022-05-16 10:16

回答 1 已采纳在点开的时候按住ctrl再单击从根源解决问题，这样你的参考文献和论文就可以同时显示了。这种不跳回的情况好像是没办法的。
请问这个超链接无法进入Controller是什么原因？ html5 java spring
2021-07-16 12:10

回答 2 已采纳把那个超链接前面加个/ 改为/showCourse
Freemarker是不是不能添加超链接？ java
2021-08-19 16:20

回答 1 已采纳 <a href="https://mail.163.com/">163</a>
python数据爬取难学吗_什么是Python爬虫?Python学习难不难?
2021-01-14 03:20

光慢光慢的博客爬虫是Python的应用领域之一，简单、入门快、就业前景好，也是Python学习者就业的首选岗位，那么什么是Python爬虫?Python爬虫学习难不难?我们一起来看看吧。什么是Python爬虫?爬虫，又称为网络爬虫，可以理解为蜘蛛...
请问各位是否有快速生成超链接及返回键的相关代码呢？开发语言有问必答
2021-09-10 22:16

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
为什么下载PDF的超链接不起作用？（没有文件） laravel php
2018-10-09 19:42

回答 1 已采纳 storage/app/public is not visible to the user You need to either move to public/... and/or create
文件路径为什么找不到？ html5
2019-12-08 13:26

回答 1 已采纳把文件拷贝到同一个文件夹下不就行了
10亿+的超链接，如何防止重复爬取？
2019-11-08 06:52

somenzz的博客前段时间领导给了一个任务：编程实现对一个指定论坛的舆情监控，在所有帖子中找出含有公司相关名称的帖子，查看是否不良言论，防止舆情风险。接到这样一个任务，内心是激动的，一方面这个任务是有点挑战性，另一方面...
pandas可读取 excel 超链接么？ python 有问必答
2021-07-02 07:56

回答 1 已采纳表格存在两种格式 .xls 和 .xlsx，所以python存在两种库分别读取这两种格式表格超链接。openpyl针对.xlsx格式，xlrd针对.xls文件。 # coding=utf-8 impo
关于#正则表达式#的问题，如何解决？(语言-python) python
2023-02-07 00:12

回答 4 已采纳 match()只有在0位置匹配成功的话才有返回，如果不是开始位置匹配成功的话，match()就返回none用search()
关于excel表格 超链接 报错问题 html5
2017-12-20 02:57

回答 3 已采纳这些链接要求先登录才能看到内容。你浏览器能打开是因为有登录过。如果你没有保存密码，并且新开浏览器，也是看不了的。我刚才点了链接，跳到的是微博首页。这不关excel的事。
什么是python爬虫？学习python爬虫难不难?
2021-04-15 15:15

是一只萨摩耶的博客例如，当它抓取一个web页面时，它会找到一个路径，这个路径实际上是指向该web页面的超链接，因此它可以爬到另一个web页面以获取数据。 python爬虫能做什么？ python爬虫的应用主要有以下三个方面： 1、爬取数据，...
C语言如何删除txt中的超链接（或者说内容）？ c++ c语言有问必答
2022-03-06 18:13

回答 3 已采纳那就逐行读取，然后判断左右尖括号，中间的字符不要存储到新文件 #include <stdio.h> int main() { FILE *fp1,*fp2; fp1 = f
什么是知识图谱？有哪些典型应用？终于有人讲明白了
2021-08-20 08:18

IT农民工1的博客它是一种基于图的数据结构，是一种知识表示的手段，可以很方便地将自然语言转化为图来表示和存储，并应用在自然语言处理问题上，例如机器翻译、问答等。到了20世纪80年代，研究人员将哲学概念本体（Ontology）引入...
什么是爬虫|Python爬虫的原理是什么
2022-01-14 20:21

程序员迪迪的博客一、爬虫是什么？如果我们把互联网比作一张大的蜘蛛网，数据便是存放于蜘蛛网的各个节点，而爬虫就是一只小蜘蛛，沿着网络抓取自己的猎物（数据）爬虫指的是：向网站发起请求，获取资源后分析并提取有用数据的程序...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月4日

悬赏问题

¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 关于大棚监测的pcb板设计
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器
¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)
¥15 Vue3地图和异步函数使用

爬取不到超链接是什么问题呢?

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新