爬虫csv获取不到全部数据

为什么只能爬到一点点数据呢，怎么才能爬到全部数据

import requests
from bs4 import BeautifulSoup
from selenium import webdriver
import time
import csv
url1 = 'https://www.mi.com/shop/category/list'
headers1 = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.188.400 QQBrowser/11.4.5225.400'}
respost1 = requests.get(url1, headers=headers1).text
res = BeautifulSoup(respost1, 'html.parser')
lst = []  # 商品名称
for i in res.find_all('span')[16:20]:  # 16:277 获取全数据
    b = i.string
    lst.append(b)
lst2 = []  # 获取到所有链接
lst4 = []
for i in lst:
    dic = {}
    try:
        drive = webdriver.Chrome()
        drive.maximize_window()
        drive.get('https://www.mi.com/shop/category/list')
        time.sleep(0.5)
        drive.find_element_by_link_text(f"{i}").click()
        time.sleep(0.5)
        drive.find_element_by_class_name('J_nav_comment').click()
        time.sleep(0.5)
        handles = drive.window_handles
        drive.switch_to.window(handles[-1])
        cur_url = drive.current_url
        w = cur_url[-6:-11:-1]  # id
        w2 = w[::-1]  # 反转
        # 接口
        url = f'https://api2.service.order.mi.com/user_comment/get_summary?show_all_tag=1&goods_id={w2}&v_pid=17972&support_start=0&support_len=10&add_start=0&add_len=10&profile_id=0&show_img=0&callback=__jp6'
        headers = {'referer': 'https://www.mi.com/',
                   'accept': 'application/json, text/plain, */*',
                   'sec-ch-ua': '"Not?A_Brand";v="8", "Chromium";v="108", "Google Chrome";v="108"',
                   'sec-ch-ua-mobile': '?0',
                   'sec-ch-ua-platform': "Windows",
                   'sec-fetch-dest': 'script',
                   'sec-fetch-mode': 'no-cors',
                   'sec-fetch-site': 'same-site',
                   'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'}
        respost = requests.get(url, headers=headers)
        data = respost.text
        con_1 = data.split(',')  # 将数据分割
        a = con_1[37]
        b = con_1[36]
        c = con_1[43]
        d = con_1[42]
        w3 = a[17:]  # 总评论数
        w4 = b[16:]  # 好评数
        w5 = c[14:]  # 满意度
        w6 = d[13:]
        dic['商品名称'] = f'{i}'
        dic['id'] = w2
        dic['总评论数'] = w3
        dic['好评数'] = w4
        dic['满意度'] = w5
        lst4.append(dic)
        print(f'{i}', w2, w3, w4, w5)
        drive.quit()  # 退出
    except :
        drive.quit()
# 循环完成之后在做保存
with open('小米商城.csv', 'a+', encoding='gbk', newline='') as f:
    write = csv.DictWriter(f, fieldnames=['商品名称', '总评论数', '好评数', '满意度', 'id'])
    write.writeheader()
    write.writerows(lst4)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
cjh4312 2022-12-24 13:46
关注
#这样可以拿到所有商品 for i in res.find_all('span',{'class':{'text'}}): d=i.text lst.append(d)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

爬虫csv获取不到全部数据 python selenium 爬虫
2022-12-24 13:06

回答 2 已采纳 #这样可以拿到所有商品 for i in res.find_all('span',{'class':{'text'}}): d=i.text lst.append(d)
爬虫xpath获取不到数据 python 爬虫
2022-12-12 01:38

回答 2 已采纳数据有可能是动态加载的，你没有爬到，先打印整个页面内容，搜索一下看有没有你需要的内容，没有的话，那内容就是动态加载的，request肯定爬取不到，那xpath肯定就提取不了呗！1.对于动态加载的数据，
python爬虫然后把数据保存到csv中但是爬不到内容 python 爬虫
2021-11-14 14:52

回答 1 已采纳这样就可以了 import requests import csv r_header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win
python 写csv scrapy_Scrapy 爬虫(3)：爬取数据不保存，就是耍流氓
2020-11-22 17:42

weixin_39641738的博客 (给Python开发者加星标，提升Python技能)作者：Zone(本文来自作者投稿)前言通过前面两篇文章《爬虫利器 Scrapy 初体验(1)》《Scrapy 爬虫(2)：听说你的爬虫又被封了？》，我们初体验也过了，爬虫代码健壮性也升级为 ...
爬虫获取数据生成csv文件时逗号自动分列怎么解决 python 爬虫
2022-04-25 14:26

回答 1 已采纳你写入的应该是一个列表吧，比如说writer.wirterow(data)你可以改成writer.wirterow([data])有帮助采纳一下哈，谢谢~
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
爬虫抓取XHR文件，获取不到响应的数据 python 爬虫
2022-08-10 16:45

回答 2 已采纳你确定你的那一大串数据都是params的吗？应该是data的，或者json的吧，post方法里面有params，但是一般不是这个格式的，你的这些里面是内嵌的，params不是这样的，如果改了以后还不行
关于爬虫解析数据的4种方式
2021-11-22 11:08

米兔-miny的博客爬虫之解析数据的4种方式：XPath解析数据、BeautifulSoup解析数据、正则表达式、pyquery解析数据。
关于Python 网络数据爬虫爬取不到数据 python
2020-06-01 15:18

回答 1 已采纳抓包看看，尤其注意url上的参数、cookie、postdata、method(get/post)、referer、useragent和content-type
爬虫爬到的数据和看见的数据不一样 python 爬虫
2022-02-21 22:34

回答 1 已采纳在xpath里把tr[3]改成tr就可以了，因为网页里的表格奇数行和偶数行不是一个tr下的元素
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
Python爬虫实战，matplotlib模块，Python实现网易云音乐歌单数据可视化
2021-12-02 07:45

编程简单学的博客前言利用Python实现网易云音乐歌单数据可视化。...本次通过对网易云音乐华语歌单数据的获取，对华语歌单数据进行可视化分析。使用matplotlib可视化库，利用这个底层库来进行可视化展示。网页分析歌单索引页
python爬虫爬取不到数据，如何分析定位？ python 有问必答爬虫
2021-11-27 11:36

回答 3 已采纳你爬虫应该是用requests发送http请求的吧，这个是无法从elements找到，你要在network的doc分析网页，你找不到的数据很大可能是ajax请求渲染前端的
python进行爬虫+数据处理+导入Mysql
2022-09-06 12:01

人帅气质佳A的博客 python 进行网络爬虫爬取文本数据，然后处理数据，导入Mysql并保存为本地CSV文件
爬虫数据采集基础
2022-06-28 23:20

m0_46427459的博客 403 禁止访问服务器拒绝此请求 404 未找到服务器找不到请求的网页 405 方法禁用服务器禁用了请求中指定的方法 406 不接受无法使用请求的内容响应请求的网页 407 需要代理授权请求者需要使用代理授权 408 请求...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月24日

悬赏问题

¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab
¥20 重新写的代码替换了之后运行hbuliderx就这样了
¥100 监控抖音用户作品更新可以微信公众号提醒
¥15 UE5 如何可以不渲染HDRIBackdrop背景
¥70 2048小游戏毕设项目
¥20 mysql架构，按照姓名分表
¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分

爬虫csv获取不到全部数据

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新