运用xpath进行，每次都只能运行出来一个数据

目标网站http://www.piaofang.biz/
爬取页面所有电影名及票房
保存csv
import requests
from lxml import etree
import csv
url = 'http://www.piaofang.biz/'
headers = {'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Mobile Safari/537.36'}
response = requests.get(url, headers=headers)
response.encoding = 'gb2312'
data = response.text
html = etree.HTML(data)
div_tag = html.xpath('//div[@class="zhuti"]')
lst = []
for div in div_tag:
dic = {}
title = div.xpath('.//td[@class="title"]/a/text()')
piaofang = div.xpath('.//td[@class="piaofang"]/span/text()')
dic['title'] = title[0]
dic['piaofang'] = piaofang[0]
print(dic)
lst.append(dic)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

pySnake1 2022-08-08 12:45

关注

原因是列表div_tag只有一项, 而变量title, piaofang有很多项。
改成这样:

import requests
from lxml import etree
import csv
url = 'http://www.piaofang.biz/'
headers = {'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Mobile Safari/537.36'}
response = requests.get(url, headers=headers)
response.encoding = 'gb2312'
data = response.text
html = etree.HTML(data)
div_tag = html.xpath('//div[@class="zhuti"]')
div=div_tag[0] # div_tag只有一项
lst = []
dic = {}
title = div.xpath('.//td[@class="title"]/a/text()')
piaofang = div.xpath('.//td[@class="piaofang"]/span/text()')
for t,p in zip(title,piaofang): # zip()作用是同时遍历两个列表
    dic['title'] = t
    dic['piaofang'] = p
    lst.append(dic)
    print(dic)

如果有帮助, 点个「采纳」按钮不谢

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

python xpath定位不到_Xpath定位方法深入探讨及元素定位失败常见情况
2021-03-17 02:40

weixin_39819138的博客一、Xpath定位方法深入探讨(1)常用的Xpath定位方法及其特点使用绝对路径定位元素。例如：driver.findElement(By.xpath("/html/body/div/form/input"))。特点：这个路径是从网页起始标签开始一直到要定位的元素的路径...
1、Windows PowerShell：脚本编程的新境界
2025-12-24 03:26

初恋是一滩水Null的博客本文深入介绍了Windows PowerShell作为现代Windows脚本编程的强大工具，从其发展历程、核心优势到实际应用进行了全面解析。文章对比了Cmd.exe、WSH与PowerShell在胶水和启用器方面的差异，重点阐述了PowerShell集成...
40、深入探索WF 4编程：从基础到高级特性
2025-07-24 15:21

corn8的博客本文深入探讨了WF 4编程的各种特性，从基础到高级功能，包括使用InvokeMethod活动调用方法、通过ActivityFunc实现动态属性、过程式与流程图风格的流程控制、异常处理机制、事务和补偿活动的应用、并行执行优化，以及...
【Python爬虫(99)】Python爬虫面试全攻略：从基础到进阶，你准备好了吗？
2025-02-27 13:58

奔跑吧邓邓子的博客例如，通过创建 Scrapy 项目，可以快速搭建一个爬虫框架，定义爬虫类、编写数据解析规则和管道处理函数，实现数据的高效抓取和处理。 1.8 项目经验在面试中，项目经验是面试官关注的重点之一。清晰阐述项目经历、...
Python Pandas PK esProc SPL，谁才是数据预处理王者？
2022-08-29 07:00

不吃西红柿丶的博客业界有很多免费的脚本语言都适合进行数据准备工作，其中Python Pandas具有多种数据源接口和丰富的计算函数，受到众多用户的喜爱；esProc SPL作为一门较新的数据计算语言，在语法灵活性和计算能力方面也很有特色，...
python-selenium-automation:使用Python和Selenium进行测试自动化，https
2021-03-09 10:51

而Selenium则是一个功能强大的Web应用程序测试框架，它支持多种编程语言，包括Python，使得通过Python进行Web自动化测试变得轻而易举。 1. **Python基础** 在深入Selenium之前，我们需要对Python有一定的了解。...
六万字带你一次性速通python爬虫基础
2022-03-04 21:56

跳探戈的小龙虾的博客网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，...本文用6w字的篇幅，力求把每一个小白变成具有爬虫基础的开发者，并能通过后续的学习，变成爬虫大咖！
Python爬虫入门教程！手把手教会你爬取网页数据_已知 (1)爬取网址信息学院首页编程实现爬取&quot；计算机科学系&quot；在&quot；信息学院&quot；主页上
2024-05-06 12:43

rr8f2haQf的博客知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到...
设计数据密集型应用第二章：数据模型与查询语言
2021-06-27 01:31

SuPhoebe的博客数据模型与查询语言关系模型与文档模型NoSQL的诞生对象关系不匹配多对一和多对多的关系文档数据库是否在重蹈覆辙？网络模型关系模型与文档数据库相比关系型数据库与文档数据库在今日的对比哪种数据模型更有助于简化...
一文读懂 Jmeter - 你以为Jmeter只能用来做压力测试？
2021-10-13 22:12

哈哥撩编程的博客该文档写于 2017年上半年并落地了公司两个接口自动化项目,记得当时使用的好像还是 3.2版本,目前最新版本也已经更新到了 5.4.1 版本,放出来吧...纯当是纪念了。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月8日

运用xpath进行，每次都只能运行出来一个数据

2条回答 默认 最新

问题事件

2条回答默认最新