爬虫网页不能进入循环

各位大佬们，小弟我刚学完爬虫基础来实战爬取50页内容

http://fund.eastmoney.com/manager/jjjl_all_penavgrowth_desc.html?rd=0.770561125401394#dt14;mcreturnjson;ftall;pn20;pi1;scpenavgrowth;stdesc

网页只有pi后面的数字有变化，1到50，用selenium，内容能爬取是对的，但是始终爬取的是第一页的内容。

困扰我好几天了，找资料，改代码都改废了，求解决，谢谢了

from selenium import  webdriver #从selenium库中调用webdriver模块
from selenium.webdriver.chrome.options import Options # 从options模块中调用Option
chrome_options = Options() # 实例化Option对象
chrome_options.add_argument('--headless') # 把Chrome浏览器设置为静默模式
driver = webdriver.Chrome(options = chrome_options)
import  time
import csv
from bs4 import BeautifulSoup
import requests
csv_file = open('基金经理2.28.csv','w',newline='')
writer=csv.writer(csv_file)
writer.writerow(['经理','时间','基金规模','收益'])


url='http://fund.eastmoney.com/manager/jjjl_all_penavgrowth_desc.html?rd=0.770561125401394#dt14;mcreturnjson;ftall;pn20;pi{real_page};scpenavgrowth;stdesc'
headers={'User-Agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81'}

number_manager_list = []
for a in range(1, 50):
    number_manager_list.append(a)

for page in range(1,4):
    act_url=url.format(real_page=page)
    driver.get(act_url)
    time.sleep(10)
    for x in number_manager_list:
        all_manager = driver.find_elements_by_tag_name('td')[5 + 7 * x].text
        all_time = driver.find_elements_by_tag_name('td')[8 + 7 * x].text
        all_money = driver.find_elements_by_tag_name('td')[9 + 7 * x].text
        all_gain = driver.find_elements_by_tag_name('td')[10 + 7 * x].text
        writer.writerow([all_manager, all_time, all_money, all_gain])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2021-03-13 22:53
关注
找到下一页按钮点一下; 或者用post上传参数.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python网页爬虫循环获取_手把手教你用 Python 搞定网页爬虫
2020-11-23 23:15

weixin_39728320的博客原标题：手把手教你用 Python 搞定网页爬虫编译：欧剃作为数据科学家的第一个任务，就是做网页爬取。那时候，我对使用代码从网站上获取数据这项技术完全一无所知，它偏偏又是最有逻辑性并且最容易获得的数据来源。在...
python网页爬虫循环获取_Python 爬虫第三篇（循环爬取多个网页）
2020-11-20 20:58

weixin_40003780的博客本篇是 python 爬虫的第三篇，在前面两篇 Python 爬虫第一篇（urllib+regex）和 Python 爬虫第二篇（urllib+BeautifulSoup）中介绍了如何获取给定网址的网页信息，并解析其中的内容。本篇将更进一步，根据给定网址...
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客爬虫可以节省我们的时间，比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再...
python爬虫详解
2021-07-11 21:56

穆瑾轩的博客 python爬虫简介 1、基本概念 1.1、什么是爬虫网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网...
Python爬虫爬取网页上的所有图片
2022-07-08 11:20

卡卡南安的博客 Python爬虫爬取网页上的所有图片。
我是如何零基础开始能写Python爬虫的
2021-02-20 12:32

刚开始接触爬虫的时候，简直惊为天人，十几行代码，就可以将无数网页的信息全部获取下来，自动选取网页元素，自动整理成结构化的文件。利用这些数据，可以做很多领域的分析、市场调研，获得很多有价值的信息。这种...
python爬虫网页崩溃怎么处理_python程序爬虫总是崩溃
2020-12-06 12:06

weixin_39872893的博客写的一个爬虫程序，主要用到以下库。但是伴随着代码增多，功能增多。经常性的程序崩溃现象，逐渐显现。pyqt5_5.8.2，requests.get，selenium+chorme，threading.Thread，queue.Queue多次完善代码与程序，甚至已经...
Python网络爬虫实例讲解
2020-12-25 08:09

爬虫程序的主要框架如上图所示，爬虫调度端通过URL管理器获取待爬取的URL链接，若URL管理器中存在待爬取的URL链接，爬虫调度器调用网页下载器下载相应网页，然后调用网页解析器解析该网页，并将该网页中新的URL添加...
使用Python和BeautifulSoup进行网页爬虫与数据采集
2024-10-18 17:17

隔窗听雨眠的博客本文深入探讨了如何使用Python和BeautifulSoup进行网页爬虫与数据采集，涵盖了从基础HTML解析到高级动态内容解析的完整过程。我们介绍了如何应对分页、处理请求异常、并发多线程抓取数据，以及如何使用Selenium处理...
Python爬虫监控：网页变化，尽在掌握
2024-08-18 23:00

2401_85761762的博客通过本文的介绍，我们了解到使用Python爬虫监控网页内容变化的方法。从技术选型到实现步骤，再到具体的代码示例，本文提供了一个完整的解决方案。在实际应用中，开发者可以根据具体需求调整监控的频率、内容和通知...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月13日

爬虫网页不能进入循环

1条回答 默认 最新

问题事件

1条回答默认最新