m0_73618418 2022-11-22 23:06 采纳率: 25%
浏览 17
已结题

python爬虫动态网页爬取 报错

import requests
import json
url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairsForPortal'
return_data = requests.get(url).text
data = json.loads(return_data)
news = data['data']
for n in news:
    picPath=n['picPath']
    mainTitle= n['mainTitle']
    newsContent = n['newsContent']
    print("来源:",newsContent,'\n',"标题:",mainTitle,'\n',"图片:",picPath)
    print('\n')

img

img

import requests
import json
url = 'http://www.ptpress.com.cn/bookinfo/getBookListForWS'
return_data = requests.get(url).text    # 在需要爬取的URL网页进行HTTP请求
data = json.loads(return_data)        # 对HTTP响应的数据JSON化
news = data['data']                 # 索引到需要爬取的内容信息
for n in news:                     # 对索引出来的JSON数据进行遍历和提取
    newsContent = n['newsContent']
    mainTitle = n['mainTitle']
    price = n['price']
    print("新书名:",bookName,'\n',"作者:",author,'\n',"价格:",price)
    print('\n')

img

请问为什么最下面的可以爬出出来,而上面的爬取不出来 报错了
请问怎样修改上面的代码才可以爬取出来呢?
谢谢

  • 写回答

2条回答 默认 最新

  • aabond 2022-11-23 10:12
    关注

    news 数据获取错误

    import requests
    import json
    url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairsForPortal'
    return_data = requests.get(url).text
    data = json.loads(return_data)
    news = data['data']['news4']
    for n in news:
        picPath=n['picPath']
        mainTitle= n['mainTitle']
        newsContent = n['newsContent']
        print("来源:",newsContent,'\n',"标题:",mainTitle,'\n',"图片:",picPath)
        print('\n')
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月1日
  • 已采纳回答 11月23日
  • 修改了问题 11月23日
  • 创建了问题 11月22日

悬赏问题

  • ¥15 用C语言完成一个复杂的游戏
  • ¥15 如何批量更改很多个文件夹里的文件名中包含文件夹名?
  • ¥50 MTK手机模拟HID鼠标出现卡顿
  • ¥20 求下下面这个数据结构代码
  • ¥20 前端 二进制文件流图片转化异常
  • ¥15 github上的这个C语言项目如何跑起来
  • ¥15 java 判断某个数 区间是否存在
  • ¥15 appium控制多个雷电模拟器问题
  • ¥15 C# iMobileDevice
  • ¥15 谁会做这个啊#ensp#Boson NetSim