用python爬取小说时，拼接url类型错误

问题遇到的现象和发生背景

用python爬取网页时，拼接url类型错误，运行后显示拼接的那段url需要转换为str类型，但是如果强制转换后输出的url就会带有[]，是无效的url，就不能继续进行对新的url的解析了

问题相关代码，请勿粘贴截图

import requests
from lxml import html
etree=html.etree
if __name__ == '__main__':
    url="https://www.shicimingju.com/book/sanguoyanyi.html"
    headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36"}
    page_text=requests.get(url,headers).content.decode('utf-8')
    tree=etree.HTML(page_text)
    li_link=tree.xpath('//div[@class="book-mulu"]/ul/li')
    fp = open('./三国.txt', 'w', encoding='utf-8')
    for link in li_link:
        #拼接错误！！！！！！
        #li_url="https://www.shicimingju.com"+str(link.xpath('./a/@href'))
        li_url = "https://www.shicimingju.com" + link.xpath('./a/@href')
        print(li_url)
        title=link.xpath('./a/text()')
        detail_text=requests.get(url=li_url,headers=headers).content.decode('utf-8')
        tree = etree.HTML(detail_text)

        content=tree.xpath('//div[@class="card bookmark-list"]/div/text()')
        fp.write(str(title+content))
        # print(content,"结束")
        print(title,'成功！！')

运行结果及报错内容

```

```li_url = "https://www.shicimingju.com" + link.xpath('./a/@href')
TypeError: can only concatenate str (not "list") to str

我的解答思路和尝试过的方法

加str强制转换

我想要达到的结果

拼接生成正确的url

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱音斯坦牛优质创作者: 编程框架技术领域 2022-01-10 19:04
关注
li_url = "https://www.shicimingju.com" + link.xpath('./a/@href')[0]

这样子就行了
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬取小说网站
2025-04-30 19:54

aspxiy的博客利用python爬取某小说网站，主要爬取小说名字，作者，类别，将其保存为三元组形式：（xxx, xxx, xxx）并将其保存至excel表格中。本文从爬取目的到爬取的各步骤都尽量详细的去复现。
python：爬取网络小说，看这一篇就够了
2023-10-15 21:38

吴小凹的博客滤除第一种的时候，我们只需要将章节这个也加入判断即可，滤除第二种错误数据我们就需要强行固定序列了，比如我们强行让它从第一章开始。需要导入的第三方包有两个，是requests和BeautifulSoup,其中一个是用于网页...
Python爬虫爬取笔趣阁小说
2022-10-30 12:38

神明却无她.的博客使用python爬取笔趣阁的实战案例，适合爬虫初学者
python爬取网页数据步骤,python爬取网页内容代码
2024-07-01 14:11

2401_86114879的博客这种情况即使是Python中级玩家也有概率会犯错，python3中的内置关键字：and,as,assert,break,class,continue,def,del,elif,else,except,False,finally,for,from,global,if,import,in,is,lambda,None,not,nonlocal,or...
Python 学习 02 —— Python如何爬取数据
2021-07-08 23:24

老板来碗小面加蛋~的博客文章目录系列文章二、Python爬虫1、任务介绍2、爬虫简介3、基本流程3.1、准备工作3.1.1、分析页面3.1.2、编码规范3.1.3、导入模块3.1.4、程序流程3.2、获取数据3.3、解析数据3.4、保存数据3.4.1、Excel表存储3.4.1、...
Python爬虫：爬取小说，支持多线程和导入读书软件
2022-06-12 01:00

Jason_254的博客还记得今天是2022年6月10日的上午，只因为昨晚无意间看到一篇小说《那年那蝉那把剑》，顿时就作者的文笔给吸引了，一口气就看了50章，可惜好日子不长久。之后就居然开始收费了，作为一名IT从业者，我深知技术...
python爬取数据并存到excel,python爬取数据的意义
2024-06-22 19:07

2401_85887359的博客爬虫的学习按照任务驱动的方式进行，最终实现douban电影Top250的基本信息抓取，包括电影的名称、douban评分、...能做什么我们可以爬取自己想看的视频、各种图片，只要是能够通过浏览器访问的数据都可以用它进行爬取。
Python爬虫第一战爬取小说
2023-03-23 17:42

AI大模型入门学习路线的博客独立做出爬取小说的爬虫利用Python取得所要信息利用Python筛选出特定信息如果你毫无 Python 基础，可以看看我亲自写的关于 Python 的基础专栏，这样子理解本文会更加轻松，当然你要是只想了解爬虫的过程，不关注具体...
【python】简单小说爬取
2025-04-03 10:51

明长歌的博客爬取小说看似方便，但背后隐藏着法律风险和道德问题。小说是作者的心血，爬取行为可能侵犯版权，甚至引发法律纠纷。支持正版不仅是对创作者的尊重，也能让你享受更优质的阅读体验。许多平台提供免费试读或优惠活动，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月10日