未使用 import语句from lxml import etree ？

之前都没什么问题，突然就来一个未使用 import语句from lxml import etree都报错，这里为什么呢，有没有朋友帮忙看看那里错了？

/Users/chenyuhui/Desktop/截屏2022-10-27 20.33.17.png

import requests
import re
from lxml import etree
import csv
import time
import asyncio
import aiohttp
import logging
import pandas as pd
import numpy as np
import random
import ssl
import certifi

ssl_context = ssl.create_default_context()
ssl_context.load_verify_locations(certifi.where())

URL1='https://movie.douban.com/subject/35131346/comments?status=P'
file_name='短评-{index}.csv'
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36',
    'cookie': 'll="108298"; bid=bQ20QaMu-Hc; push_noty_num=0; push_doumail_num=0; __utmv=30149280.12857; ct=y; gr_user_id=15663cd4-0204-441c-af43-e8b1a7d2d5f2; __gads=ID=4ed9362f7037ff69-22a328ce7fd70077:T=1666667493:RT=1666667493:S=ALNI_Mb0n4LajrFJVVuT5rLrXwGQO4aPfw; __utmz=30149280.1666760296.17.6.utmcsr=douban.com|utmccn=(referral)|utmcmd=referral|utmcct=/people/128572766/; ap_v=0,6.0; __gpi=UID=00000b6c11ffabc2:T=1666667493:RT=1666831710:S=ALNI_MbUWI8jPIZJO0A34AwiFDfTsDqfyQ; __utma=30149280.1432797394.1664965576.1666830229.1666834156.23; __utmc=30149280; __utmt=1; dbcl2="128572766:obLNF0XC3Tw"; ck=61Xh; __utmb=30149280.17.10.1666834156'
}

#定义了logging的基本配置
logging.basicConfig(level=logging.INFO,
                    format='%(asctime)s - %(levelname)s: %(message)s')
start=time.time()

URL2=URL1[0:51]+'start={start}&limit=20&status=P&sort=new_score'
URL3='https://www.douban.com/people/{authorid}/'

CONCURRENCY = 5
semaphore = asyncio.Semaphore(CONCURRENCY)

with open(file_name.format(index=re.findall('subject/(.*?)/comments',URL1)[0]), 'w',encoding='utf-8') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['序号','评论者', '评论', 'IP', '常驻地','有用量','网址'])

df=pd.DataFrame(pd.read_excel('./代理IP.xlsx'))
IPPORTS=list(df.loc[:,"IPPORTS"])
proxys = np.unique([IPPORTS for IPPORT in IPPORTS])


async def scrape_api(url):
    async with semaphore:
        try:
            logging.info('scraping %s', url)
            proxy=random.choice(proxys)
            proxies = {
                'http': 'http://' + proxy,

            }
            session.proxies=proxies
            async with session.get(url,headers=headers,ssl=ssl_context) as response:
                return await response.text()

        except aiohttp.ClientError:
            logging.error('error occurred while scraping %s', url, exc_info=True)

async def scrape_index(page):
    url = URL2.format(start=page)
    return await scrape_api(url)

async def scrape_detail(authorid):
    url = URL3.format(authorid=authorid)
    return await scrape_api(url)

async def main():
    global session
    session = aiohttp.ClientSession()
    r1=requests.get(URL1,headers=headers)
    web1=r1.text
    # print(r1.status_code)
    print(web1)
    review_counts=int(re.findall('看过\((.*?)\)',web1)[0])
    print("共{}条短评".format(review_counts))
    scrape_index_tasks = [asyncio.ensure_future(scrape_index(page)) for page in range(0,review_counts//20,20)]
    results = await asyncio.gather(*scrape_index_tasks)
    for page,web2 in enumerate(results):
        reviews=re.findall('(.*?)', web2)
        youyongs=re.findall('(.*?)', web2)
        authorids=re.findall('https://www.douban.com/people/(.*?)/" class="">',web2)
        authors = re.findall('class="">(.*?)', web2)

        for i,[review,youyong,author,authorid] in enumerate(zip(reviews,youyongs,authors,authorids)):

            with open(file_name.format(index=re.findall('subject/(.*?)/comments', URL1)[0]), 'a',encoding='utf-8') as csvfile:
                writer = csv.writer(csvfile)
                writer.writerow([i+1+page*20, author, review,"/","/",youyong,URL3.format(authorid=authorid)])


if __name__ == '__main__':
    loop=asyncio.get_event_loop()
    loop.run_until_complete(main())

    end=time.time()
    print("用时{}s".format(end-start))
#     print(reviews_sum)
#     print(authorhrefs)
#     print(levels)
#     print(len(reviews_sum))
#     print(len(authorhrefs))
#     print(len(levels))
#
# for authorhref in authorhrefs:

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-10-27 22:48
关注
这篇文章：from lxml import etree报错也许有你想要的答案，你可以看看
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python报错：lxml.etree.XPathEvalError: Invalid expression，如何解决？ python 有问必答
2022-03-30 23:22

回答 2 已采纳 Bigtit_list = html.xpath('//<div[@class="book-mid-info"]/h2/a/text()') div前面的<去掉改成 Bigtit_li
ImportError: cannot import name 'etree' from 'lxml' python
2021-08-05 11:43

回答 1 已采纳两个地方使用的python环境不一样？看cmd里面提示是conda虚拟环境但没激活？建议pycharm项目都建一个独立的虚拟环境，缺什么加什么
python3.7怎么使用lxml库支持etree 或者支持什么版本的LXML python 爬虫
2022-01-14 14:25

回答 1 已采纳我的是python3.7.6 支持的lxml是4.5.1版本
python from lxml import etree_from lxml import etree报错
2020-12-21 09:56

weixin_39899244的博客下载成功开始写代码，from lxml import etree挂了…，lxml中竟然没有etree模块换个方法from lxml import htmlet = html.etree依然挂了…解决：开始找解决办法百度中。。。，找了一堆的方法，全部失败google中。。。...
安装了lxml库但是etree还是报错 python
2021-06-21 19:36

回答 1 已采纳换个pycharm版本就好了，有的pycharm中的lxml里不包含etree
lxml 解析的时候：lxml.etree.XMLSyntaxError: Start tag expected, '<' not found, line 1, col python xml
2022-08-31 12:09

回答 2 已采纳 lxml.etree.XMLSyntaxError: Start tag expected, '<' not found, line 1, column 1有特殊字符，需要转义处理一下，具体可以
想请教一下，为啥使用lxml.etree.HTML()，解析出来的是个空[ ],, python
2022-05-27 09:44

回答 2 已采纳先打印网页文本，看看有没有这个数据，没有就是反爬了！
from lxml import etree报没有etree
2024-01-05 18:10

hhhht1234的博客以前用lxml导入etree正常使用，今天打开突然发现报红了。或者去官网下载新的lxml包。通过html包转一下就可以。
这个报错是什么意思？要怎么解决？ python vscode
2022-09-02 09:58

回答 3 已采纳你的Xpath不对，按F12，选中需要提取的xpath，右键复制xpath，
爬虫出现cannot import name 'UserAgent' from 'fake_user_agent',求解？ pycharm python 爬虫
2021-08-09 09:29

回答 1 已采纳确定导入了吗？最后那张图里，点“+”，输入fake-useragent，再点导入。
新版本lxml用不了etree.HTML怎么办 python
2022-09-08 15:27

回答 2 已采纳是这样用的呀： from lxml import etree html = etree.HTML(response.text) ret_list = html.xpath("xpath字符串")
from lxml import etree 的功能
2024-07-17 17:43

Liuzhengyue_的博客导入 etree 模块： from lxml import etree 语句用于从 lxml 库中导入 etree 模块。 etree 模块提供了一组功能，用于解析、构建和操作XML和HTML文档，提供了比标准库更高效的XML处理方法。功能和用途： ...
为什么lxml安装失败？ python
2022-10-06 23:03

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇文章讲的很详细，请看：关于lxml库安装的一些坑！！！如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评
Python3.5以上版本lxml导入etree报错的解决方案
2020-09-19 05:29

from lxml import etree ``` 改为： ```python from lxml import html # 使用时，需要通过html.etree调用 html.etree.HTML("") ``` 这种方法能够避免IDE发出的警告，并且不会影响到程序的功能性。 ##### 方法二...
Python数据提取-lxml模块
2022-02-11 14:19

liming89的博客 7.3 lxml模块的使用 1）、导入lxml的etree库 from lxml import etree 2)、利用etree.HTML，将html字符串（bytes类型或str类型）转化为Element对象，Element对象具有xpath的方法，返回结果的类别。 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月27日

悬赏问题

¥15 传染病最优控制问题，控制为什么没起作用
¥15 请问一个软件连接不上服务器了怎么办呀
¥15 ue5.3 pico打包失败求帮助
¥15 请教，这是用chatgpt写的CAD LISPD脚本，需求是画一个由双直线组成的矩形
¥50 微信小程序成功包奶茶啊
¥15 计算机博弈的六子棋代码
¥15 在Fetch API中传送的参数为何不起作用？
¥15 问题遇到的现象和发生背景 360导航页面千次ip是20元，但是我们是刷量的超过100ip就不算量了，假量超过100就不算了这是什么逻辑呢有没有人能懂的 1000元红包感谢费
¥30 计算机硬件实验报告寻代
¥15 51单片机写代码，要求是图片上的要求，请大家积极参与，设计一个时钟，时间从12:00开始计时，液晶屏第一行显示time，第二行显示时间

未使用 import语句from lxml import etree ？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新