Python爬虫# 将url携带的参数写成循环代入，如何将每次不同参数爬取到的结果依次保存到同一张excel

礼貌！快来指点指点！零基础自学.附上代码求指点🙏

import requests
from lxml import etree
import xlwt

urls = ('9787501586387', '9787501586448', '9787544258210')
list1 = []
for url in urls:
    url0 = 'https://search.dangdang.com/?key={}'.format(url)
    print(url0)

url = url0

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36'
}
# 获取响应

respond = requests.get(url, headers=headers)
# respond.encoding=''
print(respond.status_code)
html = respond.text
# with open('dang.html','w') as f:
#     f.write(respond.text)02.

htmls = etree.HTML(html)
ul = htmls.xpath('//*[@id="search_nature_rg"]/ul/li[1]')  # 获取书单
# print(ul)
for li in ul:
    book_name = li.xpath("./p[1]/a[1]/@title")  # 书名
    # print(book_name)
    # book_price = li.xpath('./p[3]/span[1]/text()')  # 价格
    # print(book_price)
    author = li.xpath('./p[@class="search_book_author"]/span[1]//text()')  # 作者
    # print(author)
    press = li.xpath("./p[@class='search_book_author']/span[3]/a/text()")  # 出版社
    # print(press)
    comments = li.xpath("p[4]/a/text()")  # 评论总数
    # print（comments)
    introduction = li.xpath("p[2]/text()")  # 简介
    # print(introduction)
    print(book_name, author, press, comments, introduction)

# 保存到excel

book_info = xlwt.Workbook(encoding='utf-8')           # 创建workbook对象
book_sheet = book_info.add_sheet('sheet1')            # 通过矩阵坐标指定要输入位置，创建表

# 写入数据，第一行参数表示“行”，第二个参数“列”，第三个参数是内容
book_sheet.write(0, 0, '书名')
book_sheet.write(0, 1, '作者')
book_sheet.write(0, 2, '出版社')
book_sheet.write(0, 3, '评论总数')
book_sheet.write(0, 4, '简介')

#将爬取到的不同字段分别保存到对应格子
book_sheet.write(1, 0, book_name)
book_sheet.write(1, 1, author)
book_sheet.write(1, 2, press)
book_sheet.write(1, 3, comments)
book_sheet.write(1, 4, introduction)

book_info.save('book_info.xls')           # 保存数据到名为book_info的excel文件里

求指点求指点😭

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-天际的海浪 2022-01-30 21:52

关注

你题目的解答代码如下：

import requests
from lxml import etree
import xlwt

urls = ('9787501586387', '9787501586448', '9787544258210')
list1 = []

book_info = xlwt.Workbook(encoding='utf-8')           # 创建workbook对象
book_sheet = book_info.add_sheet('sheet1')            # 通过矩阵坐标指定要输入位置，创建表

# 写入数据，第一行参数表示“行”，第二个参数“列”，第三个参数是内容
book_sheet.write(0, 0, '书名')
book_sheet.write(0, 1, '作者')
book_sheet.write(0, 2, '出版社')
book_sheet.write(0, 3, '评论总数')
book_sheet.write(0, 4, '简介')
ind = 1
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36'
}

for url in urls:
    url0 = 'https://search.dangdang.com/?key={}'.format(url)
    print(url0)

    # 获取响应
    respond = requests.get(url0, headers=headers)
    # respond.encoding=''
    print(respond.status_code)
    html = respond.text
    # with open('dang.html','w') as f:
    #     f.write(respond.text)02.

    htmls = etree.HTML(html)
    ul = htmls.xpath('//*[@id="search_nature_rg"]/ul/li[1]')  # 获取书单
    # print(ul)
    for li in ul:
        book_name = li.xpath("./p[1]/a[1]/@title")[0]  # 书名
        # print(book_name)
        # book_price = li.xpath('./p[3]/span[1]/text()')  # 价格
        # print(book_price)
        author = li.xpath('./p[@class="search_book_author"]/span[1]//text()')[0]  # 作者
        # print(author)
        press = li.xpath("./p[@class='search_book_author']/span[3]/a/text()")[0]  # 出版社
        # print(press)
        a = li.xpath("p[5]/a")  # 评论总数
        comments = a[0].xpath("text()")[0] if len(a)>0 else "(没有评论)"
        introduction = li.xpath("p[2]/text()")[0]  # 简介
        # print(introduction)
        print(book_name, author, press, comments, introduction)

        # 保存到excel

        #将爬取到的不同字段分别保存到对应格子
        book_sheet.write(ind, 0, book_name)
        book_sheet.write(ind, 1, author)
        book_sheet.write(ind, 2, press)
        book_sheet.write(ind, 3, comments)
        book_sheet.write(ind, 4, introduction)
        ind +=1

book_info.save('book_info.xls')           # 保存数据到名为book_info的excel文件里

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

Python开发：从入门到精通
2025-07-16 08:45

莲华君的博客用 Python 以“道”驭“术”，将编程思想与实践应用相结合，引导读者不仅掌握Python语言，更能建立科学的编程世界观，最终达到知行合一的境界。
Python 爬虫案例
2022-10-19 07:37

wespten的博客大数据采集：通过爬虫获取特定行业（如汽车行业）股票的基本信息，并获取单只股票的历史行情数据。大数据存储：根据自定义的时间间隔定时获取涨幅前60名股票的实时行情数据，并存储在数据库中。大数据分析：计算股票...
Python爬取网站数据
2024-03-17 20:08

Vermouth-1的博客 Python爬取网站数据前言什么是爬虫？通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程爬虫合法还是违法？在法律上是不被禁止的但是也有违法风险爬虫带来的风险可以体现在如下2方面爬虫...
python基础知识整理
2019-09-02 11:27

岳来的博客 python 基础知识整理
Spider爬虫笔记[更新中...]
2020-08-31 15:36

Sami9的博客 urllib库是python中最基本的一个网页请求库，可以模拟浏览器行为，向指定的服务器发送一个请求，并可以保存服务器返回的数据。 request下的urlopen()和urlretrieve() urlopen() from urllib import request # ...
面试经验总结
2024-07-13 19:39

遇到BUG就睡觉的博客如何知道一个 python 对象的类型3.用 re 匹配文本的时候，和有什么区别?4.什么是 PEP85.Django里的MTV架构是什么？6.querysetF 和q的作用7.contenttypes 是什么?通常我们用来解决什么问题?8.谈谈 RESTful 和 Django ...
面经-hangzhou
2022-07-08 20:27

云F的博客接收方原因： TCP将接收到的数据包保存在接收缓存里，如果TCP接收数据包到缓存的速度大于应用程序从缓存中读取数据包的速度，多个包就会被缓存，应用程序就有可能读取到多个首尾相接粘到一起的包。解决粘包问题： ...
【艾琪出品】《计算机应用基础》【试题汇总2】
2020-09-01 02:33

island33的博客已知“str='Python#C++##Python'”,则“str.rfind('Java')”返回的结果是( )。 A 0 B 12 C -1 D 报错 13. 执行“print(0x20)”,则在屏幕上会输出( )。 A 20 B 0x20 C 16 D 32 14. 下列选项中,描述正确的是( )。 A ...
模拟面试面试题汇总
2021-04-27 18:45

凌波微步_大先生的博客 #延迟队列顾名思义就是延迟执行消息，比如我们可以增加一个队列并设置其超时时间为 10 秒并且不设置任何消费者，等到消息超时，我们可以将消息放入死信队列，让消费者监听这个死信队列就达到了延迟队列的效果。...
Python开发：从零基础到项目实战
2025-12-15 12:03

莲华君的博客用 Python 以“道”驭“术”，将编程思想与实践应用相结合，引导读者不仅掌握Python语言，更能建立科学的编程世界观，最终达到知行合一的境界。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月30日

Python爬虫# 将url携带的参数写成循环代入，如何将每次不同参数爬取到的结果依次保存到同一张excel

2条回答 默认 最新

问题事件

2条回答默认最新