python爬虫代码出现错误

import os
import requests #发送HTTP请求
import random #
import time
from bs4 import BeautifulSoup
from lxml import etree
import threading
from fake_useragent import UserAgent
import pandas as pd
import numpy as np #用于计算
from pyecharts import options as opts
from pyecharts.charts import Map
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Line
from pyecharts.charts import Funnel
from pyecharts.faker import Faker

ua = UserAgent(use_cache_server=False)
headers ={
'User-Agent': ua.chrome,
}
url = 'https://movie.douban.com/top250?start=0&filter=%27
request =requests.get(url,headers=headers)
print(request)

BsBOJ=BeautifulSoup(request.content,'lxml')
pic = BsBOJ.find_all(attrs={'class': 'pic'})
film_urls=[]
for x in pic:
href = x.a.get('href')
film_urls.append(href)
print(film_urls)
film_url='https://movie.douban.com/subject/1291561/'
request =requests.get(film_url,headers=headers,timeout=10)
request.encoding = 'utf-8'
film_info=[]
BsBOJ=BeautifulSoup(request.text,'html.parser')
#排名
rank = BsBOJ.find(attrs={'class': 'top250-no'}).text.split('.')[1]
#电影名
film_name = BsBOJ.find(attrs={'property': 'v:itemreviewed'}).text.split(' ')[0] #split 将中英文从空格处分开
#导演
director = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[1].split(':')[1].split('/')
#编剧
scriptwriter = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[2].split(':')[1].split('/')
#主演
actor = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[3].split(':')[1].split('/')
#类型
filmtype = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[4].split(':')[1].split('/') #
#制片国家/地区
area = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[5].split(':')[1].split('/') #
#语言
language = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[6].split(':')[1].split('/') #
#上映日期
initialReleaseDate = min(BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[7].split(':')[1].split('/')).split('(')[0] #
#片长
runtime = BsBOJ.find(attrs={'property': 'v:runtime'}).text #
#评分（平均分）
rating_num = BsBOJ.find(attrs={'property': 'v:average'}).text #
#五星百分比
stars5_rating_per = BsBOJ.find(attrs={'class': 'rating_per'}).text #
#评价人数
rating_people = BsBOJ.find(attrs={'property': 'v:votes'}).text #
film_info=[rank,film_name,director,scriptwriter,actor,filmtype,area,language,initialReleaseDate,runtime,rating_num,stars5_rating_per,rating_people]
print(film_info)

出现错误，错误显示是：ImportError: cannot import name 'ProxySchemeUnsupported' from 'requests.packages.urllib3.exceptions

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

honestman_ 2022-08-23 16:13

关注

导入了太多没有用的模块，参考我的代码：

import requests #发送HTTP请求
from bs4 import BeautifulSoup
headers ={
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36"
}
url = 'https://movie.douban.com/top250?start=0&filter=%27'
request =requests.get(url,headers=headers)
print(request)

BsBOJ=BeautifulSoup(request.content,'lxml')
pic = BsBOJ.find_all(attrs={'class': 'pic'})
film_urls=[]
for x in pic:
    href = x.a.get('href')
    film_urls.append(href)
print(film_urls)
film_url='https://movie.douban.com/subject/1291561/'
request =requests.get(film_url,headers=headers,timeout=10)
request.encoding = 'utf-8'
film_info=[]
BsBOJ=BeautifulSoup(request.text,'html.parser')
#排名
rank = BsBOJ.find(attrs={'class': 'top250-no'}).text.split('.')[1]
#电影名
film_name = BsBOJ.find(attrs={'property': 'v:itemreviewed'}).text.split(' ')[0] #split 将中英文从空格处分开
#导演
director = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[1].split(':')[1].split('/')
#编剧
scriptwriter = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[2].split(':')[1].split('/')
#主演
actor = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[3].split(':')[1].split('/')
#类型
filmtype = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[4].split(':')[1].split('/') #
#制片国家/地区
area = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[5].split(':')[1].split('/') #
#语言
language = BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[6].split(':')[1].split('/') #
#上映日期
initialReleaseDate = min(BsBOJ.find(attrs={'id': 'info'}).text.split('\n')[7].split(':')[1].split('/')).split('(')[0] #
#片长
runtime = BsBOJ.find(attrs={'property': 'v:runtime'}).text #
#评分（平均分）
rating_num = BsBOJ.find(attrs={'property': 'v:average'}).text #
#五星百分比
stars5_rating_per = BsBOJ.find(attrs={'class': 'rating_per'}).text #
#评价人数
rating_people = BsBOJ.find(attrs={'property': 'v:votes'}).text #
film_info=[rank,film_name,director,scriptwriter,actor,filmtype,area,language,initialReleaseDate,runtime,rating_num,stars5_rating_per,rating_people]
print(film_info)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

Python爬虫代码集合.rar
2024-01-11 21:14

Python爬虫代码集合是一个压缩包，包含了十余个Python爬虫的源码实例，这些源码是学习和理解Python网络爬虫技术的宝贵资源。在Python编程语言中，爬虫是用于自动化网络数据抓取的程序，它能帮助我们从互联网上获取...
python烟花代码 python爬虫案例
2024-01-11 21:19

Python是一种广泛应用于各种领域的编程语言，特别是在Web开发、数据分析、人工智能和自动化任务中。在这个案例中，我们将探讨两个与Python相关的主题：烟花代码和爬虫技术。首先，让我们来看看"Python烟花代码"。...
python 爬虫代码
2023-03-09 21:49

qq_繁华的博客 python 爬虫代码
简单的python爬虫，代码完整
2018-06-21 10:24

Python是一种广泛应用于Web开发、数据分析、人工智能等多个领域的高级编程语言，其简洁明了的语法使得初学者也能快速上手。在IT行业中，Python爬虫是获取网络数据的重要工具，尤其对于数据挖掘、网站分析和自动化...
python简单爬虫代码【自学尝试】
2022-03-27 15:44

在这个"python简单爬虫代码【自学尝试】"中，我们将探讨Python爬虫的基础知识，以及如何通过Python编写一个简单的网络爬虫。首先，Python中的爬虫主要依赖于一些第三方库，如BeautifulSoup、requests和Scrapy等。`...
Python爬虫项目案例-源代码
2025-01-04 15:12

Python爬虫是一种利用Python编程语言进行网络数据抓取的程序。随着互联网技术的发展，网络数据的爆炸性增长使得爬虫技术变得尤为重要。Python爬虫可以自动化地从网页上提取所需的数据信息，广泛应用于搜索引擎、数据...
Python爬虫实践代码示例.zip
2023-09-22 22:40

在这个压缩包中，我们可以看到一个名为“Python爬虫实践代码示例-1.txt”的文件，这很可能是详细讲解或展示Python爬虫代码的一个文本文件。 Python作为一门易于学习且功能强大的编程语言，被广泛应用于爬虫开发。其...
Python网络爬虫代码
2017-10-09 20:33

【Python网络爬虫代码】是基于Python3编程语言实现的一款数据抓取工具，主要用于从互联网上，特别是百度百科这类网站，自动获取指定网页中的信息。爬虫技术在信息技术领域扮演着重要角色，它能帮助我们高效地提取...
Python爬虫数据可视化分析大作业.zip
2022-05-29 10:12

Python爬虫数据可视化分析大作业是一个综合性的Python实战项目，旨在教授如何利用Python进行网络爬虫，对抓取的数据进行处理、分析，并通过可视化手段展示结果。该项目涵盖了多个关键的知识点，包括Python基础、网络...
Python爬虫详解[项目源码]
2025-11-12 16:13

通过编写爬虫代码，我们可以自动化地从豆瓣网站上获取电影信息，并最终将这些数据整理后导出到Excel文件中，便于进行进一步的数据分析和处理。本文全面地介绍了Python爬虫的理论基础与实践操作，使读者能够从零...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月23日

python爬虫代码出现错误

1条回答 默认 最新

问题事件

1条回答默认最新