BjergsenK 2022-04-16 15:54 采纳率: 100%
浏览 44
已结题

在写爬虫运用xlwt库将网页信息写入execl中遇到的问题

问题遇到的现象和发生背景

使用xlwt库将爬虫获取当当网的图书信息写入excel中时遇到了数据格式错误无法写入的问题

问题相关代码

import requests
import xlwt

def dangdang(url):
res = requests.get(url, headers=headers)
res.encoding =res.apparent_encoding
book = xlwt.Workbook(encoding='utf-8')
sheet = book.add_sheet('Book')
cont =0
dom = etree.HTML(res.text, etree.HTMLParser())

book_infos = dom.xpath('//li[starts-with(@class, "line")]')

for book_info in book_infos:
    date = []
  ...................................(此处使用了xpath语句对网页内容进行抓取)
    date.append(name), date.append(now_price), date.append(pre_price), date.append(author), date.append(time), date.append(publisher), date.append(comment), date.append(detail)
    # 遍历输入数据到工作簿里面
    for i in range(cont, cont + 1):
        for a, b in enumerate(date):# 使用enumerate函数返回列表的索引和对应的值
            sheet.write(i,a,b)  # 将数据写入到工作簿里面
    cont += 1  # 循环结束行数加一
    info = {
        '书名': name,
        '折扣价': now_price,
        '定价': pre_price,
        '作者': author,
        '出版日期': out_date.replace(' /', ''),
        '出版社': publisher,
        '评论数': comment,
        '简介': detail
    }
    print(info)
book.save('Book.xls')
运行结果及报错内容

img

我的解答思路和尝试过的方法

曾在CSDN中搜索知道是数据格式问题,但本人语法功底较差,在使用了几次不同的数据强制类型转换后问题仍未得到解决,故在此求各位指点。

我想要达到的结果

img

  • 写回答

1条回答 默认 最新

  • ~白+黑 Python领域新星创作者 2022-04-18 16:41
    关注

    你抓回来的数据比如name,是这样的[name,],不是字符串就是个列表,你把列表再往表格里写,当然写不进去,你爬下来的比如name之类用join都给变成单个字符串,就能写进去了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 5月6日
  • 已采纳回答 4月28日
  • 修改了问题 4月17日
  • 创建了问题 4月16日

悬赏问题

  • ¥170 如图所示配置eNSP
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改
  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥15 键盘指令混乱情况下的启动盘系统重装