python爬取网页表格一行内存在多个文件

这种表格应如何爬取，英飞拓的第三列、第四列里存在多个文件。我按第四列的发布时间print是这个页面共有51个文件，但是按第1列的公司代码print只有30个
报错：InvalidSchema: No connection adapters were found for '2022-01-27 11:46'

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

CSDN专家-showbo 2022-01-27 16:00

关注

直接请求数据接口获取数据接口，不需要用selenium采集，代码如下

import requests
import time
headers = {
'user-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.99 Safari/537.36 Edg/97.0.1072.69',
'referer':'http://www.cninfo.com.cn/new/commonUrl?url=disclosure/list/notice',
'X-Requested-With':'XMLHttpRequest'
}
data={'column': 'szse_latest',
'pageNum': 1,
'pageSize': 30,
'sortName': '',
'sortType':'' ,
'clusterFlag': 'true'}
d = requests.post('http://www.cninfo.com.cn/new/disclosure',headers=headers,data=data).json()
for items in d['classifiedAnnouncements']:
    for item in items:
        print(item['secCode'])
        print(item['secName'])
        print(item['announcementTitle'])

        announcementTime=str(item['announcementTime'])#发布时间是时间戳，格式要转下
        announcementTime=int(announcementTime[0:len(announcementTime)-3])
        announcementTime=time.localtime(announcementTime)
        print(time.strftime("%Y-%m-%d", announcementTime))
        print(item['adjunctUrl'])
        print('---------------')

    print();
    print()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(2条)

报告相同问题？

关注问题

python爬虫爬取网页表格数据
2020-09-20 17:53

总结来说，这个Python爬虫程序展示了如何利用requests和BeautifulSoup库来抓取网页上的表格数据，并将其保存为CSV文件。在实际应用中，你可以根据需要修改这个基础框架，以适应不同网页结构和更复杂的数据抓取需求。...
Python基于pandas爬取网页表格数据
2020-09-16 21:41

在Python编程中，爬取网页数据是一项常见的任务，特别是对于数据分析师和数据科学家而言。`pandas`库作为处理数据的强大工具，不仅擅长数据清洗、分析，还内置了爬取网页表格数据的功能，大大简化了网页抓取的过程。...
python爬取网页表格数据并写入到excel
2021-10-22 14:12

毛维的博客 python爬取网页表格数据并写入到excel 获取银行网页中外汇数据： http://fx.cmbchina.com/Hq/History.aspx?nbr=%e7%be%8e%e5%85%83&startdate=2009-01-01&enddate=2021-10-22&page=1 代码如下： import...
python怎么爬取网页数据,python爬取网页数据步骤
2024-06-24 06:32

ab524100的博客到此这篇关于如何用六步教会你使用python爬虫爬取数据的文章就介绍到这了,更多相关python爬虫爬取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！读者小狗：知道你对...
python爬取网页表格_Python基于pandas爬取网页表格数据
2020-11-23 16:27

weixin_39811193的博客今天介绍的黑科技是pandas自带爬虫功能，pd.read_html()，只需传人url，一行代码搞定。原网页结构如下：python代码如下：import pandas as pdurl='http://www.kuaidaili.com/free/'df=pd.read_...
beautifulsoup爬取网页中的表格_用 Python 爬取网页
2020-11-20 00:10

weixin_39756273的博客来自公众号：优达学城Udacity作者：Kerry Parker编译：欧剃作为数据科学家的第一个任务，就是做网页爬取。那时候，我对使用代码从网站上获取数据这项技术完全一无所知，它偏偏又是最有逻辑性并且最容易获得的数据...
python爬取网页表格到excel,python爬取网页上的表格
2023-12-24 04:47

Leospanb87的博客以前还以为爬虫很难，结果一上手，从初学到把东西爬下来，一个小时都不到就解决了不学c语言可以直接学python吗。到此这篇关于如何用六步教会你使用python爬虫爬取数据的文章就介绍到这了,更多相关python爬虫爬取数据...
使用Python爬取网页中的表格保存到word
2022-04-30 00:54

m0_62346827的博客复制网页中文字和表格保存到word中，不仅有文字，还有表格。推荐使用Python-docx库。
python爬取网页表格数据匹配,python爬虫——数据爬取和具体解析
2021-04-27 08:55

日月龙腾的博客标签：patterndivmattxt保存关于jsonresultwith open关于正则表达式的更多用法，可参考链接：https://blog.csdn.net/weixin_40040404/article/details/81027081一、正则表达式：1.常用正则匹配：URL：^https?://[a-...
python爬取网页表格数据匹配_爬取表格类网站数据并保存为excel文件
2020-11-28 14:18

weixin_39800062的博客本文转载自以下网站:50 行代码爬取东方财富网上市公司 10 年近百万行财务报表数据 https://www.makcyun.top/web_scraping_withpython6.html主要学习的地方:1.分析网站的ajax请求信息2.构造参数3.发起请求后处理获得...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月27日

python爬取网页表格一行内存在多个文件

3条回答 默认 最新

问题事件

3条回答默认最新