lithium锂 2021-07-15 08:59 采纳率: 66.7%
浏览 46
已采纳

爬取内容写入txt中,只会看到一列数据,打印测试会有div列中所有列数据

from typing import Text
import requests
from lxml import etree
import time
headers= {
    'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'
}

url = 'https://www.baidu.com/s?ie=UTF-8&wd=%E7%99%BE%E5%BA%A6%E7%83%AD%E6%90%9C'
page = requests.get(url,headers=headers)

if len(page)>100:
    print("解析成功")

html = page.content

tree = etree.HTML(html).xpath('//*[@id="1"]/div/div[2]/div/div[2]/div[1]/div/div/div[1]/div/div[2]/div[@class="hot-item_1473U"]')
for i in tree:
    r = i.xpath("./a/text()")
    t = i.xpath("./a/@href")

    print(str(r)+'\n'+str(t) + '\n' +"-------------------------------------------------------------")
    with open('./text.text','w',encoding='utf-8') as f:
        f.write(str(r))
        f.write('\n')
        f.write(str(t))

这里会要求以TypeError: write() argument must be str, not list 、str写入
结果写出空白或者只有一列数据

  • 写回答

4条回答 默认 最新

  • 江天暮雪丨 2021-07-15 09:37
    关注

    可能的原因: with open('./text.text','w',encoding='utf-8') as f:
    使用文件操作模式 w 会清空文件内容,重新写入,尝试改为 a+ 模式: with open('./text.text','a+',encoding='utf-8') as f:

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 已采纳回答 7月15日
  • 创建了问题 7月15日

悬赏问题

  • ¥15 请问有人会紧聚焦相关的matlab知识嘛?
  • ¥15 网络通信安全解决方案
  • ¥50 yalmip+Gurobi
  • ¥20 win10修改放大文本以及缩放与布局后蓝屏无法正常进入桌面
  • ¥15 itunes恢复数据最后一步发生错误
  • ¥15 关于#windows#的问题:2024年5月15日的win11更新后资源管理器没有地址栏了顶部的地址栏和文件搜索都消失了
  • ¥100 H5网页如何调用微信扫一扫功能?
  • ¥15 讲解电路图,付费求解
  • ¥15 有偿请教计算电磁学的问题涉及到空间中时域UTD和FDTD算法结合的
  • ¥15 three.js添加后处理以后模型锯齿化严重