吐司CCQ 2022-01-23 16:32 采纳率: 50%
浏览 54
已结题

爬虫解析网页代码解析不全

用python爬取网页信息
在F12查看源代码中的代码,在python解析网页的时候没有,这属于反爬吗?有什么方法可以解决

  • 写回答

3条回答 默认 最新

  • CSDN专家-showbo 2022-01-23 16:54
    关注

    题主要的代码如下

    img

    import requests
    import json
    
    url="https://www.qcc.com/api/bigsearch/bytagList?pageIndex=1&pageSize=5&roundDesc=&searchKey=%E6%8B%BC%E5%A4%9A%E5%A4%9A"
    #下面3个头不能少,cookie和自定义的请求头764826f3fbf3fdcfbd14关联
    headers={
     'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.99 Safari/537.36',
     'cookie':'acw_tc=3ad8379516429868957524722ef7b22873794fd19a75e64637c8f3ea85;',
     '764826f3fbf3fdcfbd14':'5ddbd29438181f111f65aa2f5fc41d0af5443051d921401595b36a08394177a0fc9a21af0f4b22976d96cff8fabd55d968ee1760059000ecb6f12984fab9678c'
    }
    
    data=requests.get(url,headers=headers).json()
    for item in data['Result']:
        print(item['Name'])
        print(item['Intro'])
        print(item['CompanyName'])
        print('\n\n\n\n')
    
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 2月1日
  • 已采纳回答 1月24日
  • 创建了问题 1月23日

悬赏问题

  • ¥15 CVRP 图论 物流运输优化
  • ¥15 Tableau online 嵌入ppt失败
  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 下图接收小电路,谁知道原理
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测