爬虫网页不能进入循环

各位大佬们，小弟我刚学完爬虫基础来实战爬取50页内容

http://fund.eastmoney.com/manager/jjjl_all_penavgrowth_desc.html?rd=0.770561125401394#dt14;mcreturnjson;ftall;pn20;pi1;scpenavgrowth;stdesc

网页只有pi后面的数字有变化，1到50，用selenium，内容能爬取是对的，但是始终爬取的是第一页的内容。

困扰我好几天了，找资料，改代码都改废了，求解决，谢谢了

from selenium import  webdriver #从selenium库中调用webdriver模块
from selenium.webdriver.chrome.options import Options # 从options模块中调用Option
chrome_options = Options() # 实例化Option对象
chrome_options.add_argument('--headless') # 把Chrome浏览器设置为静默模式
driver = webdriver.Chrome(options = chrome_options)
import  time
import csv
from bs4 import BeautifulSoup
import requests
csv_file = open('基金经理2.28.csv','w',newline='')
writer=csv.writer(csv_file)
writer.writerow(['经理','时间','基金规模','收益'])


url='http://fund.eastmoney.com/manager/jjjl_all_penavgrowth_desc.html?rd=0.770561125401394#dt14;mcreturnjson;ftall;pn20;pi{real_page};scpenavgrowth;stdesc'
headers={'User-Agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81'}

number_manager_list = []
for a in range(1, 50):
    number_manager_list.append(a)

for page in range(1,4):
    act_url=url.format(real_page=page)
    driver.get(act_url)
    time.sleep(10)
    for x in number_manager_list:
        all_manager = driver.find_elements_by_tag_name('td')[5 + 7 * x].text
        all_time = driver.find_elements_by_tag_name('td')[8 + 7 * x].text
        all_money = driver.find_elements_by_tag_name('td')[9 + 7 * x].text
        all_gain = driver.find_elements_by_tag_name('td')[10 + 7 * x].text
        writer.writerow([all_manager, all_time, all_money, all_gain])

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
cclxpp123 2021-03-13 22:53
关注
找到下一页按钮点一下; 或者用post上传参数.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

爬虫网页不能进入循环 python
2021-03-13 21:56

回答 1 已采纳找到下一页按钮点一下; 或者用post上传参数.
python爬虫如何用for循环翻页 python 有问必答
2021-07-04 16:59

回答 2 已采纳重点还是从网页上分析翻页的网址构造情况，即baseurl及请求的url要写准确,另外可能需要补充一些请求参数。
求解决关于python爬虫问题，进不去循环？ python 有问必答
2021-07-07 15:46

回答 2 已采纳估计是soup.find_all('div',class_='imgbox')没有返回值。从这几个方面排查修改：检查所写节点是否正确，根据页面代码进行修改; html应该是文本格式，即在askUrl中
python爬虫万能代码-获取网页
2023-01-12 14:12

Python爬虫架构主要由五个部分组成，分别是调度器、URL管理器、网页下载器、网页解析器、应用程序（爬取的有价值数据）。调度器：相当于一台电脑的CPU，主要负责调度URL管理器、下载器、解析器之间的协调工作。 ...
我的python爬虫的循环遍历为什么报错？ python 爬虫
2023-01-17 13:25

回答 5 已采纳你把res打印出来看下。应该是request.get方法没有获取到数据，或者获取的数据格式和你想要的不一致，所以报错了。如果是获取的数据不对，检查下您的请求参数是否正确。
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
爬虫一直循环运行，不结束进程 python selenium 爬虫
2022-12-26 21:12

回答 2 已采纳 import requests from lxml import etree import re from selenium import webdriver import time import c
python网页爬虫循环获取_手把手教你用 Python 搞定网页爬虫
2020-11-23 23:15

weixin_39728320的博客原标题：手把手教你用 Python 搞定网页爬虫编译：欧剃作为数据科学家的第一个任务，就是做网页爬取。那时候，我对使用代码从网站上获取数据这项技术完全一无所知，它偏偏又是最有逻辑性并且最容易获得的数据来源。在...
如何解决python爬虫问题？ python 人工智能爬虫
2022-08-15 09:11

回答 1 已采纳应该是css选择器里面的规则不够明确，可改成href = selectors.css('div.container div div div ul li a::attr(href)').getall()
python爬虫疑问 python 爬虫
2022-09-28 20:27

回答 1 已采纳因为有的url 比如https://wx3.sinaimg.cn/large/005tGGVqgy1h6hjo33dy1j323i72qb2e.jpg 后面多了一个空格，把空格去掉就行了，解决问题的话
Python爬虫# 将url携带的参数写成循环代入，如何将每次不同参数爬取到的结果依次保存到同一张excel python 有问必答爬虫
2022-01-30 21:37

回答 2 已采纳你题目的解答代码如下： import requests from lxml import etree import xlwt urls = ('9787501586387', '9787501586
python网页爬虫循环获取_Python 爬虫第三篇（循环爬取多个网页）
2020-11-20 20:58

weixin_40003780的博客本篇是 python 爬虫的第三篇，在前面两篇 Python 爬虫第一篇（urllib+regex）和 Python 爬虫第二篇（urllib+BeautifulSoup）中介绍了如何获取给定网址的网页信息，并解析其中的内容。本篇将更进一步，根据给定网址...
python爬虫没有结果返回 python 爬虫
2023-03-10 15:16

回答 4 已采纳 import requests from lxml import etree import pandas as pd url = 'https://www.jjwxc.net/topten.php
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客爬虫可以节省我们的时间，比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再...
我是如何零基础开始能写Python爬虫的
2021-02-25 09:13

刚开始接触爬虫的时候，简直惊为天人，十几行代码，就可以将无数网页的信息全部获取下来，自动选取网页元素，自动整理成结构化的文件。利用这些数据，可以做很多领域的分析、市场调研，获得很多有价值的信息。这种...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月13日

悬赏问题

¥15 人在外地出差，速帮一点点
¥15 如何使用canvas在图片上进行如下的标注，以下代码不起作用,如何修改
¥15 Windows 系统cmd后提示“加载用户设置时遇到错误”
¥50 vue router 动态路由问题
¥15 关于#.net#的问题：End Function
¥15 无法import pycausal
¥15 VS2022创建MVC framework提示：预安装的程序包具有对缺少的注册表值的引用
¥15 weditor无法连接模拟器Local server not started, start with？
¥20 6-3 String类定义
¥15 嵌入式--定时器使用

爬虫网页不能进入循环

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新