cxfxynpy 2023-03-11 21:03 采纳率: 44.4%
浏览 18
已结题

lis中获取不到数据


"""
http://www.ccgp-hunan.gov.cn/page/notice/more.jsp

https://hunan.zcygov.cn/luban/announcement/list?utm=a0017.b0064.3.5.f7fcb4c03c7411ed84984b6678c33275
需求
1.招投标网站爬虫软件
2.需要有软件界面
3.可以选择下载保存公告文件
4.文件格式pdf
"""

import requests
from lxml import etree

url = 'http://www.ccgp-hunan.gov.cn/mvc/getNoticeList4Web.do'
headers = {
    'Accept': 'application/json, text/javascript, */*; q=0.01',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
    # 'Cookie': 'JSESSIONID=BD97B12D61360D93BEC5912F62B0F8BC',
    'Origin': 'http://www.ccgp-hunan.gov.cn',
    'Referer': 'http://www.ccgp-hunan.gov.cn/page/notice/more.jsp',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',
    'X-Requested-With': 'XMLHttpRequest',
}
data = {
    'pType': '',
    'prcmPrjName': '',
    'prcmItemCode': '',
    'prcmOrgName': '',
    'startDate': '2023-01-01',
    'endDate': '2023-03-11',
    'prcmPlanNo': '',
    'page': '1',
    'pageSize': '18',
}
cookies = {
    'JSESSIONID': 'BD97B12D61360D93BEC5912F62B0F8BC',
}
resp = requests.post(url,headers=headers,data=data,cookies=cookies)
data = resp.json()["rows"]
tree = etree.HTML(resp.text)

lis = tree.xpath('//table[@class="ejcggg"]/tr')
print(lis)

  • 写回答

1条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-03-11 21:18
    关注

    你这是个json数据地址,为什么要用 lxml,用json啊

    import json
    j = json.loads(resp.text)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 3月19日
  • 已采纳回答 3月11日
  • 创建了问题 3月11日

悬赏问题

  • ¥170 如图所示配置eNSP
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改
  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥15 键盘指令混乱情况下的启动盘系统重装