叨叨的猫 2021-03-05 22:04 采纳率: 100%
浏览 53
已采纳

爬取下来的title已列表形式存储,如何保存到文件中?

 

#需求:获取58同城二手房的房源信息
#url:https://huzhou.58.com/ershoufang
import requests
from lxml import etree

if __name__ == "__main__":
    url='https://huzhou.58.com/ershoufang'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81'
    }
    #获取页面源码
    html = requests.get(url=url,headers=headers).text
    #进行数据解析
    tree = etree.HTML(html)  #实例化一个etree对象
    title = tree.xpath('//div[@class="property-content"]//h3/text()')
    #print(li_list)
    fp =open('58.text','w',encoding='utf-8')
    fp.write(title+'\n')

报错信息:TypeError: can only concatenate list (not "str") to list

视频中老师是通过for 循环将所有的标题爬下来,但是我这样写好像也是可以把所有的标题爬下来。

视频中的58二手房网页HTML源码和我现在去访问时的写法不一样。所以不知道我这样写的有没有问题。

  • 写回答

2条回答 默认 最新

  • coagenth 2021-03-05 22:51
    关注

    tree.xpath 解析出来的是列表,你需要将其转换成字符串形式写入txt文档。可将最后两行改为:

    with open('58.txt','w',encoding='utf-8') as fp:

      fp.write('\n'.join(title))

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 我的数据无法存进链表里
  • ¥15 神经网络预测均方误差很小 但是图像上看着差别太大
  • ¥15 Oracle中如何从clob类型截取特定字符串后面的字符
  • ¥15 想通过pywinauto自动电机应用程序按钮,但是找不到应用程序按钮信息
  • ¥15 如何在炒股软件中,爬到我想看的日k线
  • ¥15 seatunnel 怎么配置Elasticsearch
  • ¥15 PSCAD安装问题 ERROR: Visual Studio 2013, 2015, 2017 or 2019 is not found in the system.
  • ¥15 (标签-MATLAB|关键词-多址)
  • ¥15 关于#MATLAB#的问题,如何解决?(相关搜索:信噪比,系统容量)
  • ¥500 52810做蓝牙接受端