我想把采集到的数据保存到pdf中该怎么做


"""
http://www.ccgp-hunan.gov.cn/page/notice/more.jsp

https://hunan.zcygov.cn/luban/announcement/list?utm=a0017.b0064.3.5.f7fcb4c03c7411ed84984b6678c33275
需求
1.招投标网站爬虫软件
2.需要有软件界面
3.可以选择下载保存公告文件
4.文件格式pdf
"""

import csv
import os
import PyPDF2
import requests
from lxml import etree
import json
from bs4 import BeautifulSoup
from pprint import pprint
url = 'http://www.ccgp-hunan.gov.cn/mvc/getNoticeList4Web.do'
headers = {
    'Accept': 'application/json, text/javascript, */*; q=0.01',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
    # 'Cookie': 'JSESSIONID=BD97B12D61360D93BEC5912F62B0F8BC',
    'Origin': 'http://www.ccgp-hunan.gov.cn',
    'Referer': 'http://www.ccgp-hunan.gov.cn/page/notice/more.jsp',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',
    'X-Requested-With': 'XMLHttpRequest',
}
data = {
    'pType': '',
    'prcmPrjName': '',
    'prcmItemCode': '',
    'prcmOrgName': '',
    'startDate': '2023-01-01',
    'endDate': '2023-03-11',
    'prcmPlanNo': '',
    'page': '1',
    'pageSize': '18',
}
cookies = {
    'JSESSIONID': 'BD97B12D61360D93BEC5912F62B0F8BC',
}
resp = requests.post(url,headers=headers,data=data,cookies=cookies)
r = resp.text
response = json.loads(resp.text)
lis = response["rows"]
# soup = BeautifulSoup(r,'lxml')
# list = soup.find_all('tr')

print(lis)
data = []
for i in lis:
    # item = {}
    # # print(i)
    # item['名字'] = i['ORG_NAME']
    # item['公告'] = i['NOTICE_TITLE']
    # item['时间'] = i['NEWWORK_DATE']
    # # item['链接'] = i['href']
    # data.append(item)
    title = i['ORG_NAME']
    announcement = i['NOTICE_TITLE']
    time = i['NEWWORK_DATE']

# with open('kaohe.csv','w',encoding='utf-8-sig',newline='') as f:
# #     writer = csv.DictWriter(f,fieldnames=['名字','公告','时间'])
# #     writer.writeheader()
# #     writer.writerows(data)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

嗷呜大嘴狼 2023-03-12 16:25

关注

安装PyPDF2库，可以在终端中使用以下命令：


pip install pypdf2

在代码中添加以下内容，将每条数据保存为一个PDF文件：

# 创建PDF文件对象
pdf = PyPDF2.PdfFileWriter()

# 遍历数据列表
for i in lis:
    # 获取数据项
    title = i['ORG_NAME']
    announcement = i['NOTICE_TITLE']
    time = i['NEWWORK_DATE']
    
    # 创建PDF页面对象
    page = PyPDF2.pdf.PageObject.createBlankPage(None, 72*11, 72*8.5)
    
    # 在页面上添加数据
    page.mergePage(PyPDF2.pdf.PageObject.createTextObject(None, title))
    page.mergePage(PyPDF2.pdf.PageObject.createTextObject(None, announcement))
    page.mergePage(PyPDF2.pdf.PageObject.createTextObject(None, time))
    
    # 将页面添加到PDF文件中
    pdf.addPage(page)
    
    # 保存PDF文件
    with open('data.pdf', 'wb') as f:
        pdf.write(f)

答案来自 https://www.wodianping.com/

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

我想把采集到的数据保存到pdf中该怎么做 python
2023-03-12 16:10

回答 2 已采纳安装PyPDF2库，可以在终端中使用以下命令： pip install pypdf2 在代码中添加以下内容，将每条数据保存为一个PDF文件： # 创建PDF文件对象 pdf = PyPDF2.P
打印激光相机采集到的数据 c++ visualstudio 有问必答
2021-08-24 18:22

回答 1 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
api方式采集，把接口数据导入表中 json 数据库
2017-05-23 08:16

回答 2 已采纳 api方式采集的数据一般是json吧,应该是吧json格式反序列化,导入到表中具体方法:1.可以使用Newtonsoft.Json.dll把json数据反序列化成Model,然后添加到数据库中;
Python项目开发实战_网络爬虫批量采集股票数据保存到Excel中_编程案例实例课程教程.pdf
2023-05-02 16:41

通过编写爬虫，将指定日期时段内的全部上市公司股票数据爬取下来，并按照股票代码保存到相应的 Excel 文件中。这个案例主要分为两大步骤：（1）要知道上市公司有哪些；（2）根据每一个上市公司的股票编号爬取数据...
在keil里怎么定义空数组，把ad采集到的数存放到数组里？ c语言
2021-05-07 16:51

回答 1 已采纳代码没看到你调用init_tracebak_monitor函数啊，断点会进去么？
c++编程打开usb采集卡 c++ 图像处理
2017-11-29 08:56

回答 1 已采纳 https://wenku.baidu.com/view/6275289e1eb91a37f0115c2c.html
C#winform拿到这一组数组如何分割开取到我想要的数据呢？ .net c# visual studio
2021-11-01 18:41

回答 3 已采纳 string str="aaajbbbjccc"; string[] sArray=str.Split('j'); foreach(string i in sArray) Response.Writ
终于有人把数据挖掘讲明白了
2021-03-03 15:08

hzbooks的博客 01什么是数据挖掘数据挖掘（DataMining）应该是一门大家都听说过，但又不太容易说清楚的课程。在数据科学领域，乃至在更大的计算机科学领域，数据挖掘就好比山东蓝翔，大家不一定都知道挖...
怎么用socket编程读取开发板AD采集的数据 c语言
2021-05-15 20:22

回答 1 已采纳说一下思路： 1.开发板读取AD采集的数据到内存 2.开发板初始化好网络，等待socket连接 3.需要读数据的软件A，向开发板发送connect请求 4.connect建立好后，软件A向开发
stm32单片机调用AS7341，采集数据到lab view编写的上位机图表 c语言 stm32
2023-04-18 16:09

回答 1 已采纳这有个类似的问题, 你可以参考下: https://ask.csdn.net/questions/7468819你也可以参考下这篇文章：基于STM32单片机和Labview的温湿度波形实时显示串口助手
做实时控制，C++采集数据，python用深度学习回归预测该怎么做？ c++ python 有问必答
2021-07-02 11:18

回答 1 已采纳建议用socket通信比较好，不同语言之间调用没有直接通信的好，而且调用过程可能会出现参数传递或等等问题。
想做数据分析，都需要学些什么？
2021-05-06 17:55

数据STUDIO的博客数据分析职业晋升路径首先看看数据分析职业晋升路径。职业薪资数据分析专员8-15K数据分析师12-20K资深数据分析师20-35K数据分析专家35-60K数据科学家60K起这篇文章的受众一般...
kafka拉取不到数据 java kafka 分布式有问必答
2022-02-16 19:32

回答 4 已采纳重新开一个topic，然后先启动consumer，再启动producer，再发消息，你这个可能是consumer已经在broker里有了自己的offset，就会读不到之前producer发送到brok
从书中学爬虫靠谱吗？深夜读《爬虫实战从数据到产品》
2020-11-22 17:56

梦想橡皮擦的博客《爬虫实战从数据到产品》非专业解读，对你有那么一点点都是极好的。
《Go语言精进之路，从新手到高手的编程思想、方法和技巧1》读书笔记和分享
2022-11-24 17:04

尚墨1111的博客 Go语言精进之路，从新手到高手的编程思想、方法和技巧
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月12日

悬赏问题

¥15 各位请问平行检验趋势图这样要怎么调整？说标准差差异太大了
¥15 delphi webbrowser组件网页下拉菜单自动选择问题
¥15 wpf界面一直接收PLC给过来的信号，导致UI界面操作起来会卡顿
¥15 init i2c:2 freq:100000[MAIXPY]: find ov2640[MAIXPY]: find ov sensor是main文件哪里有问题吗
¥15 运动想象脑电信号数据集.vhdr
¥15 三因素重复测量数据R语句编写，不存在交互作用
¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab

我想把采集到的数据保存到pdf中该怎么做

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新