运用xpath进行，每次都只能运行出来一个数据

目标网站http://www.piaofang.biz/
爬取页面所有电影名及票房
保存csv
import requests
from lxml import etree
import csv
url = 'http://www.piaofang.biz/'
headers = {'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Mobile Safari/537.36'}
response = requests.get(url, headers=headers)
response.encoding = 'gb2312'
data = response.text
html = etree.HTML(data)
div_tag = html.xpath('//div[@class="zhuti"]')
lst = []
for div in div_tag:
dic = {}
title = div.xpath('.//td[@class="title"]/a/text()')
piaofang = div.xpath('.//td[@class="piaofang"]/span/text()')
dic['title'] = title[0]
dic['piaofang'] = piaofang[0]
print(dic)
lst.append(dic)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

qfcy_ 2022-08-08 12:45

关注

原因是列表div_tag只有一项, 而变量title, piaofang有很多项。
改成这样:

import requests
from lxml import etree
import csv
url = 'http://www.piaofang.biz/'
headers = {'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Mobile Safari/537.36'}
response = requests.get(url, headers=headers)
response.encoding = 'gb2312'
data = response.text
html = etree.HTML(data)
div_tag = html.xpath('//div[@class="zhuti"]')
div=div_tag[0] # div_tag只有一项
lst = []
dic = {}
title = div.xpath('.//td[@class="title"]/a/text()')
piaofang = div.xpath('.//td[@class="piaofang"]/span/text()')
for t,p in zip(title,piaofang): # zip()作用是同时遍历两个列表
    dic['title'] = t
    dic['piaofang'] = p
    lst.append(dic)
    print(dic)

如果有帮助, 点个「采纳」按钮不谢

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

运用xpath进行，每次都只能运行出来一个数据 python
2022-08-08 12:11

回答 2 已采纳原因是列表div_tag只有一项, 而变量title, piaofang有很多项。改成这样: import requests from lxml import etree import csv ur
xpath获取数据时的一个问题 python 爬虫
2023-02-12 21:37

回答 3 已采纳最好不要用全路径，路径写的越长月容易出错，页面经过浏览器渲染会增加一些诸如tbody的标签，而代码请求的相应中不一定会有，因此建议尽量简化xpath路径，我的宗旨是：在能准确定位的基础上，路径越短越好
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
python xpath定位不到_Xpath定位方法深入探讨及元素定位失败常见情况
2021-03-17 02:40

weixin_39819138的博客一、Xpath定位方法深入探讨(1)常用的Xpath定位方法及其特点使用绝对路径定位元素。例如：driver.findElement(By.xpath("/html/body/div/form/input"))。特点：这个路径是从网页起始标签开始一直到要定位的元素的路径...
从浏览器复制的xpath为什么打出来是个空列表 python 有问必答爬虫
2022-05-13 15:29

回答 2 已采纳积存金是用iframe加载的，在下面这个页面里面https://mybank.icbc.com.cn/icbc/newperbank/perbank3/gold/goldaccrual_query_o
怎么获取一个页面的 xpath路径列表(全部xpath路径) python
2022-05-08 22:17

回答 1 已采纳 //*这是个星号
mysql只能插进去一条数据 mysql 有问必答爬虫
2021-12-19 16:25

回答 1 已采纳你的缩进不对，导致只执行了一次。21到32行要向右缩进一格吧
Python Pandas PK esProc SPL，谁才是数据预处理王者？
2022-08-29 07:00

不吃西红柿丶的博客业界有很多免费的脚本语言都适合进行数据准备工作，其中Python Pandas具有多种数据源接口和丰富的计算函数，受到众多用户的喜爱；esProc SPL作为一门较新的数据计算语言，在语法灵活性和计算能力方面也很有特色，...
如何使用pycharm的requests爬取数据，用xpath进行解析的时候为空[？(语言-python) python 有问必答
2022-03-14 23:11

回答 3 已采纳你先输出一下request+s爬取的数据,看看是否有你需要爬取的内容你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内
xpath解析网页文件，每行结尾都出现一个奇怪的编码“&#13” python 爬虫
2021-11-29 17:50

回答 2 已采纳 method默认为xml，设置为html就行了 etree.tostring(h2, encoding="utf-8", method='html')
pycharm中xpath返回的一直是一个空列表 python
2022-10-18 22:14

回答 2 已采纳 Xpath定位少一步，我的代码和结果是这个，你看看是不是你的需求，有问题再说替换你的解析代码如下 html = etree.HTML(resp.text) divs = html.x
设计数据密集型应用第二章：数据模型与查询语言
2021-06-27 01:31

SuPhoebe的博客数据模型与查询语言关系模型与文档模型NoSQL的诞生对象关系不匹配多对一和多对多的关系文档数据库是否在重蹈覆辙？网络模型关系模型与文档数据库相比关系型数据库与文档数据库在今日的对比哪种数据模型更有助于简化...
python爬取房源，可以运行，但是每次只爬出一条是什么原因？ python
2022-09-22 19:36

回答 3 已采纳已修改，爬到不止一页，就是你信息提取包括了一些其他符号，自己再处理一下就好了 from lxml import etree import requests import csv import tim
一文读懂 Jmeter - 你以为Jmeter只能用来做压力测试？
2021-10-13 22:12

哈哥撩编程的博客该文档写于 2017年上半年并落地了公司两个接口自动化项目,记得当时使用的好像还是 3.2版本,目前最新版本也已经更新到了 5.4.1 版本,放出来吧...纯当是纪念了。
手把手教你JS逆向搞定字体反爬并获取某招聘网站信息
2021-11-25 09:00

Python进阶者的博客下次点击上方“Python爬虫与数据挖掘”，进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤Python让我们相遇。大家好，我是霖hero。之前给大家分享过手把手...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月8日

悬赏问题

¥15 linux驱动，linux应用，多线程
¥20 我要一个分身加定位两个功能的安卓app
¥15 基于FOC驱动器，如何实现卡丁车下坡无阻力的遛坡的效果
¥15 IAR程序莫名变量多重定义
¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助

运用xpath进行，每次都只能运行出来一个数据

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新