谁教我这个爬虫怎怎么了

想爬取该电影网页的电影名称，但为什么啥也不显示？
求各位指点


#测试
from urllib import request
from bs4 import BeautifulSoup
head={}
head['User-Agent']='Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/111.0'
req=request.Request('https://movie.douban.com/explore',headers=head)
response=request.urlopen(req)
html=response.read()
html=html.decode('utf-8')
soup=BeautifulSoup(html,'html.parser')
#print(soup.prettify())
object=soup.select('div.drc-subject-info-title')
for movie in object:
    name=movie.find('span').text
    print(name)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-04-11 14:42
关注
以下内容部分参考ChatGPT模型：

首先，你需要先获取该电影网页的源代码，可以使用urllib库中的request模块来实现。接着，你需要使用BeautifulSoup库来解析该网页的源代码，并通过查找特定的HTML元素来获取电影名称。

下面是一个简单的爬虫示例代码，可以帮助你开始学习爬虫：

from urllib import request from bs4 import BeautifulSoup # 设置请求头，模拟浏览器请求 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 发送请求，获取电影网页的源代码 url = 'http://www.xxx.com' req = request.Request(url, headers=headers) response = request.urlopen(req) html = response.read() # 解析网页源代码，获取电影名称 soup = BeautifulSoup(html, 'html.parser') movies = soup.find_all('div', class_='movie') # 假设电影名称在class为'movie'的div元素中 for movie in movies: name = movie.find('h2').text # 假设电影名称在h2元素中 print(name)

当然，这只是一个简单的示例代码，具体的实现还需要根据你要爬取的网页结构来进行调整。另外，注意在爬取网页时要尊重网站的规则，不要频繁请求同一个页面。

如果我的建议对您有帮助、请点击采纳、祝您生活愉快
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python 爬虫基础网络爬虫、数据采集、Python编程、数据处理
2023-08-12 18:32

资源描述：这个资源是关于Python爬虫基础的教程，旨在帮助初学者掌握如何使用Python编程语言构建简单的网络爬虫，从网页中抓取数据，并进行基本的数据处理和存储。内容概要：教程涵盖了Python爬虫的基本概念、...
Python快乐编程-网络爬虫
2024-01-26 10:43

本主题“Python快乐编程——网络爬虫”将深入探讨如何利用Python进行网络爬虫开发，让你在快乐编程的过程中掌握这一技能。首先，我们需要了解Python的基础知识，包括语法、变量、控制结构（如if-else、for循环）、...
网络爬虫编程教程
2018-08-08 15:32

2. Python编程：Python是最常用的网络爬虫编程语言，因其简洁的语法和丰富的库资源，如BeautifulSoup、requests等，使得网络爬虫开发变得简单。二、网络爬虫架构 1. 发送请求：首先，爬虫需要向目标网站发送HTTP...
基于python的百度云网盘爬虫
2024-01-30 11:04

【标题】"基于Python的百度云网盘爬虫"是一个项目，旨在教用户如何使用Python编程语言编写程序来抓取并下载百度云网盘上的公开资源。该项目涵盖了网络爬虫技术，结合了百度云盘的API接口，以及可能涉及的前端和后端...
Python语言教程&案例&相关项目资源
2025-08-14 15:10

Python语言是一种高级编程语言，以其简洁明了的语法和强大的功能受到广泛的欢迎。它支持多种编程范式，包括面向对象、命令式、函数式和过程式编程。Python语言的开发理念是强调代码的可读性和简洁的语法设计，这使得...
Go并发编程项目开发实战-网络爬虫框架设计和实现-案例解析实例详解课程教程.pdf
2023-05-22 09:43

它模仿的主要对象有两个,一个是坐在计算器前使用网络浏览器访问网络内容的人类用户,另一个就是网络浏览器。网络爬虫会模仿人类用户输入某个网站的网络地址,并试图访问该网站上的内容,还会模仿网络浏览器根据给定的...
Python爬虫教程——7个爬虫小案例（附源码）_爬虫实例
2024-07-15 13:44

东眠的鱼的博客爬虫的全称为网络爬虫，简称爬虫，别名有网络机器人，网络蜘蛛等等。网络爬虫是一种自动获取网页内容的程序，为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术，将互联网中丰富的网页信息保存到本地，形成...
Python爬虫进阶：Scrapy框架教程
2021-06-11 04:03

Python爬虫进阶教程掌握了python爬虫基本理论和操作，本课程主要以讲授Scarpy框架来实现python爬虫进阶该课程主要分享Python爬虫框架Scarpy的安装、使用、selector选择器的使用 spider的使用、itempipeline的使用...
【Go语言高并发】基于Goroutine与Channel的企业级网络爬虫架构设计：构建高效分布式Octopus爬虫系统
2025-10-11 13:19

内容概要：本文是一份Go语言高并发编程的实战教程，通过从零构建一个名为Octopus的企业级网络爬虫项目，系统讲解Go语言的并发编程核心机制。教程涵盖Goroutine、Channel和sync包等关键技术，并逐步实现从单任务同步...
清华大学基于Java语言的《自己动手写网络爬虫》全部源码共10个章节.rar
2022-04-09 11:33

2. **Java编程基础**：作为课程的基础，你需要熟悉Java编程语言，包括基本语法、类、对象、异常处理等。Java以其跨平台性和强大的库支持，成为编写网络爬虫的常用语言。 3. **网络请求库**：在Java中，如...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月11日

谁教我这个爬虫怎怎么了

3条回答 默认 最新

以下内容部分参考ChatGPT模型：

如果我的建议对您有帮助、请点击采纳、祝您生活愉快

问题事件

3条回答默认最新