weixin_45725490 2022-07-02 00:17 采纳率: 50%
浏览 92
已结题

python爬虫,etree模块有问题

问题遇到的现象和发生背景

python爬虫xpath

问题相关代码,请勿粘贴截图

import requests

from lxml import etree

url =  "https://movie.douban.com/chart"
head = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:90.0) Gecko/20100101 Firefox/90.0"}
response = requests.get(url,headers=head).text
tree = etree.HtML(response)
li_list = tree.xpath('//div[@class="pl2"]/a')
fp=open('a.txt','w',encoding='utf-8')
#li遍历li_list
for li in li_list:
    print(li+'\n')
    #把文件写入文件
    fp.write(li+'\n')
fp.close()



运行结果及报错内容

Traceback (most recent call last):
  File "C:/Users/HY/PycharmProjects/pachong/main.py", line 8, in <module>
    tree = etree.HtML(response)
AttributeError: module 'lxml.etree' has no attribute 'HtML'
我的解答思路和尝试过的方法

from lxml import html
selector =  html.etree.HTML(text)

我想要达到的结果

etree没有html部分,有点懵逼

  • 写回答

1条回答 默认 最新

  • 天际的海浪 2022-07-02 00:26
    关注

    你HtML 中T写成小写了, HTML应该是全大写

    img

    另外 li 是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本
    print(li+'\n')
    fp.write(li+'\n')
    应该改成
    print(li.text+'\n')
    fp.write(li.text+'\n')

    你题目的解答代码如下:

    import requests
    
    from lxml import etree
    
    url =  "https://movie.douban.com/chart"
    head = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:90.0) Gecko/20100101 Firefox/90.0"}
    response = requests.get(url,headers=head).text
    tree = etree.HTML(response)   #HTML应该是全大写
    li_list = tree.xpath('//div[@class="pl2"]/a')
    fp=open('a.txt','w',encoding='utf-8')
    #li遍历li_list
    for li in li_list:
        print(li.text+'\n')  #li是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本
        #把文件写入文件
        fp.write(li.text+'\n')  #li是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本
    fp.close()
    

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 7月10日
  • 已采纳回答 7月2日
  • 创建了问题 7月2日

悬赏问题

  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算