m0_73618418 2022-11-22 23:06 采纳率: 25%
浏览 17
已结题

python爬虫动态网页爬取 报错

import requests
import json
url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairsForPortal'
return_data = requests.get(url).text
data = json.loads(return_data)
news = data['data']
for n in news:
    picPath=n['picPath']
    mainTitle= n['mainTitle']
    newsContent = n['newsContent']
    print("来源:",newsContent,'\n',"标题:",mainTitle,'\n',"图片:",picPath)
    print('\n')

img

img

import requests
import json
url = 'http://www.ptpress.com.cn/bookinfo/getBookListForWS'
return_data = requests.get(url).text    # 在需要爬取的URL网页进行HTTP请求
data = json.loads(return_data)        # 对HTTP响应的数据JSON化
news = data['data']                 # 索引到需要爬取的内容信息
for n in news:                     # 对索引出来的JSON数据进行遍历和提取
    newsContent = n['newsContent']
    mainTitle = n['mainTitle']
    price = n['price']
    print("新书名:",bookName,'\n',"作者:",author,'\n',"价格:",price)
    print('\n')

img

请问为什么最下面的可以爬出出来,而上面的爬取不出来 报错了
请问怎样修改上面的代码才可以爬取出来呢?
谢谢

  • 写回答

2条回答 默认 最新

  • aabond 2022-11-23 10:12
    关注

    news 数据获取错误

    import requests
    import json
    url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairsForPortal'
    return_data = requests.get(url).text
    data = json.loads(return_data)
    news = data['data']['news4']
    for n in news:
        picPath=n['picPath']
        mainTitle= n['mainTitle']
        newsContent = n['newsContent']
        print("来源:",newsContent,'\n',"标题:",mainTitle,'\n',"图片:",picPath)
        print('\n')
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月1日
  • 已采纳回答 11月23日
  • 修改了问题 11月23日
  • 创建了问题 11月22日

悬赏问题

  • ¥100 微信小程序跑脚本授权的问题
  • ¥100 房产抖音小程序苹果搜不到安卓可以付费悬赏
  • ¥15 STM32串口接收问题
  • ¥15 腾讯IOA系统怎么在文件夹里修改办公网络的连接
  • ¥15 filenotfounderror:文件是存在的,权限也给了,但还一直报错
  • ¥15 MATLAB和mosek的求解问题
  • ¥20 修改中兴光猫sn的时候提示失败
  • ¥15 java大作业爬取网页
  • ¥15 怎么获取欧易的btc永续合约和交割合约的5m级的历史数据用来回测套利策略?
  • ¥15 有没有办法利用libusb读取usb设备数据