python小白使用pd.DataFrame模块保存多个网页数据，运行后的结果只有第一页的数据

import  requests
from lxml import etree
headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}
r = requests.get('https://book.douban.com/subject/34857216/comments/hot?p={1-3}',headers=headers)
t=r.text

s=etree.HTML(t)

x=(s.xpath('//*[@id="comments"]/ul[1]/li/div[2]/p/span/text()'))    #浏览器复制
import  pandas  as  pd
import  numpy as np
df=pd.DataFrame(x)
df.to_csv('duanping6.csv',encoding="utf_8_sig")

图片说明

请教一下各位大神，请问这个什么原因导致只能爬取保存第一页的数据，是因为url写的有问题吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Lonelypatients° 2020-04-15 09:26
关注
"https://book.douban.com/subject/34857216/comments/hot?p={}".format(i) p是分页值, 你得给他一个循环值例如有三页, 也就是range一个1,4,这样就有三页数据了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python使用pd.mean()函数后出现Warning，请问该如何解决？ python
2021-08-10 17:01

回答 1 已采纳看你取到的df数据是不是含有其他非数值的列，或者你索引的时候就只取各科目列就行，warning只要不报错也没关系
python中使用groupby后，运行成功，但并未实现合并，甚至数据还是DataFrame python 有问必答
2022-03-25 18:10

回答 3 已采纳写成这样：d=date.groupby('账卡号')['余额'].sum().to_frame(name='余额').reset_index()print(d)
python pandas DataFrame()合并数据的问题 python 数据分析
2022-05-08 22:00

回答 2 已采纳 pandas 提供了可以合并两张表的函数merge，带参数how="outer"是取来自左右的并集，匹配不到的话元素就会设为Null最后做个if判断就可再加一列总成绩 import pandas as
Python中Pandas库提供的函数——pd.DataFrame的基本用法
2023-10-03 17:28

o涂鸦小巷的菇凉o的博客 DataFrame可以从各种数据源导入数据，如CSV文件、Excel表格、SQL数据库等，并且可以将数据导出为不同格式的文件。：DataFrame提供了丰富的数据操作方法，包括数据筛选、切片、合并、分组、聚合、排序等。：您可以对...
pandas dataframe数据的列如何转换为列表？ python 数据分析
2022-04-24 10:52

回答 1 已采纳不是提示你了，看下你的数据里面有没有'Module-A'这一列
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
【python, append】将一列数据改为百分比、并解决append替换前面数据的问题 python 数据分析
2022-06-20 17:15

回答 2 已采纳 import pandas as pd import numpy as np df = pd.DataFrame({'收益率': ['4', 0.5, np.NAN, 0.36,0.45678,
Python3 pd.dataframe写入csv和xlsx
2022-01-18 17:33

B博士的博客 Python3 pd.dataframe写入csv和xlsx。代码如下： df = pd.DataFrame( columns={'dist','distance','409','425', '442', '458', '474', '491', '507', '523', '540', '556','572', '589', '605', '621', '637', '...
请问如何将第一行dataframe数据设置为列索引？而不使用默认索引 python 数据挖掘
2020-04-07 15:55

回答 1 已采纳 data.columns=data.iloc[0].values data=data.drop(0) data=data.reset_index(drop=True)
Python pandas包里创建DataFrame对象时的奇怪现象，希望能和大家讨论一下DataFrame的底层逻辑和运行规则 python 数据分析有问必答
2022-03-21 21:13

回答 2 已采纳没太明白你的意思，数据帧(DataFrame)是二维数据结构，即数据以行和列的表格方式排列。数据帧(DataFrame)的功能特点：潜在的列是不同的类型大小可变标记轴(行和列)可以对行和列执行算术运算
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
pd.DataFrame的参数，我想把数据框第一行当作列名
2023-01-17 15:32

MCPlayer542的博客在创建pd.DataFrame时，可以使用"header"参数将数据框第一行作为列名。例如： import pandas as pd data =[[1, 2, 3], [4, 5, 6]] df = pd.DataFrame(data, columns=['a', 'b', 'c']) 或者你可以在读入csv的时候...
Python给Dataframe循环添加列时数据会被吞 python
2022-08-12 15:44

回答 3 已采纳因为巴伦台前面重复出现过，所以你在设置的时候设置了前面的那一列，而不是自动新增一列你需要检查一下是不是真的有两个地区是同一个名字
Python数据统计_pd.DataFrame各列数值统计
2022-12-21 10:16

菜鸟岩歌的博客 Python数据统计，对pd.DataFrame各列数值统计
pd.DataFrame用法
2022-07-28 08:32

@呵哈哈的博客 1.DataFrame介绍一个Datarame表示一个表格，类似电子表格的数据结构，包含一个经过排序的列表集，它的每一列都可以有不同的类型值（数字，字符串，布尔等等）。Datarame有行和列的索引；它可以被看作是一个Series的...
没有解决我的问题, 去提问

悬赏问题

¥50 Kubernetes&Fission&Eleasticsearch
¥15 有没有帮写代码做实验仿真的
¥15 報錯：Person is not mapped，如何解決？
¥30 vmware exsi重置后登不上
¥15 易盾点选的cb参数怎么解啊
¥15 MATLAB运行显示错误，如何解决？
¥15 c++头文件不能识别CDialog
¥15 Excel发现不可读取的内容
¥15 关于#stm32#的问题：CANOpen的PDO同步传输问题
¥20 yolov5自定义Prune报错，如何解决？

python小白 使用pd.DataFrame模块保存多个网页数据，运行后的结果只有第一页的数据

1条回答 默认 最新

悬赏问题

python小白使用pd.DataFrame模块保存多个网页数据，运行后的结果只有第一页的数据

1条回答默认最新