用scrapy有数据缺失，求助大佬！感谢

图片说明

爬取代码如下

import scrapy
from bs4 import BeautifulSoup
from dianying.items import DianyingItem
import re

class DianyingspiderSpider(scrapy.Spider):
    name = 'dianyingSpider'
    allowed_domains = ['http://dianying.2345.com/list/----2019---.html']
    start_urls = ['http://dianying.2345.com/list/----2019---.html']
    #start_urls =[]
    #for i in range(1,3):
    #    start_urls.append('http://dianying.2345.com/list/----2019---'+str(i)+'.html')

    def parse(self, response):

        soup = BeautifulSoup(response.text,'lxml')
        anchorTag = soup.find( 'ul',attrs = {'class':"v_picTxt pic180_240 clearfix"})  
        tags = anchorTag.find_all('li',attrs={'media':re.compile('\d{6}')})   #找到不同电影的不同代码

        items = []
        for tag in tags:


            item = DianyingItem()
            item['name']= tag.find('span',attrs={'class':'sTit'}).get_text() #爬取电影名

            item['score'] = tag.find('span',attrs={'class':'pRightBottom'}).get_text().replace('分',' ') #爬取评分

            item['leadingRole'] = tag.find('span',attrs={'class':'sDes'}).get_text() #爬取主演

            items.append(item)
        return items

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2020-09-17 09:32
关注
https://bbs.csdn.net/topics/391847368

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

毕业设计 - 基于python网易新闻scrapy爬虫数据分析与可视化大屏展示（包含演示视频、数据库文档）
2024-04-04 12:28

原来已经用Python开发了新闻网站项目，这个项目进行了2次开发，加入基于Scrapy框架爬取网易新闻数据，爬取到的数据保存到mysql数据库里面，然后采用python后端语言进行各种数据分析，将分析的结果在前端用echarts...
Python爬虫框架Scrapy教程《PDF文档》
2024-10-02 21:27

Scrapy，Python开发的一个快速,高层次的web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。任何人都可以根据需求方便的修改。它也提供了多种类型爬虫...
Python爬虫框架scrapy获取汽车之家二手车数据
2024-06-11 03:06

创建一个Scrapy项目演示如何批量获取数据，支持断点续传，保存到Excel中。 1、创建Scrapy项目：scrapy startproject car_spider 2、定义Item： class CarSpiderItem(scrapy.Item): brand = scrapy.Field() # 品牌 ...
使用Scrapy抓取职位招聘数据-爬虫python代码
2022-06-12 08:47

基于Python和Echarts职位画像系统，使用Scrapy抓取职位招聘数据，使用Django+echarts完成数据可视化。环境安装配置建议直接安装anconda，然后git clone后进入项目目录，执行pip install -r requirements.txt ...
基于Scrapy实现LianJia数据爬取的Python源码（课程设计）.zip
2024-04-22 17:31

基于Scrapy实现LianJia数据爬取的Python源码（课程设计）.zip本项目代码经过严格调试，确保可以运行！98分项目、放心下载使用。可作为期末课程设计、课程大作业等。具有较高的学习借鉴价值！基于Scrapy实现LianJia...
Python语言基于Scrapy兼职招聘网站爬虫数据分析设计
2024-05-13 22:21

Scrapy是Python的一个爬虫框架，...在爬取数据之后，我们可以使用Python中的各种数据分析库来对数据进行处理和分析。例如，我们可以使用Pandas来处理数据，使用Matplotlib来绘制图表，使用NumPy来进行科学计算，等等。
Python使用scrapy采集数据过程中放回下载过大页面的方法
2021-01-20 04:49

本文实例讲述了Python使用scrapy采集数据过程中放回下载过大页面的方法。分享给大家供大家参考。具体分析如下：添加以下代码到settings.py，myproject为你的项目名称复制代码代码如下:DOWNLOADER_...
Python使用scrapy采集数据时为每个请求随机分配user-agent的方法
2021-01-20 04:58

本文实例讲述了Python使用scrapy采集数据时为每个请求随机分配user-agent的方法。分享给大家供大家参考。具体分析如下：通过这个方法可以每次请求更换不同的user-agent，防止网站根据user-agent屏蔽scrapy的蜘蛛 ...
python爬虫-使用Scrapy框架爬取数据
2025-01-13 22:29

差一点成熟。的博客本篇文章主要讲解了Scrapy库的基本使用，使用Scrapy库提取黑马程序员“软件测试自学全套课程”模块的视频名称、学习人数、课程等级和视频评分。
python语言，Scrapy框架中国珍稀濒危植物数据采集分析，涵盖数据分析
2024-07-03 07:59

中国珍稀濒危植物信息系统采集的各省市区（地方）保护野生植物数据，...数据采集使用python的经典采集框架Scrapy，Scrapy是一个开源和distributed的爬虫框架，用于抓取web站点并从页面中提取结构化的数据，简单易用。
没有解决我的问题, 去提问

用scrapy有数据缺失，求助大佬！感谢

1条回答 默认 最新

1条回答默认最新