为什么用request-html爬取的内容为空？

以下是我的代码和运行结果，请问各位大佬为什么我运行内容为空？谢谢各位

from requests_html import HTMLSession
from requests_html import HTML
import requests
import time
import json
import random
import sys
import os
import csv

from fake_useragent import UserAgent#

session = HTMLSession()
url = 'https://car.autohome.com.cn/'
#https://car.autohome.com.cn/config/series/3862.html

USER_AGENTS = [
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/535.20 (KHTML, like Gecko) Chrome/19.0.1036.7 Safari/535.20",
    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER",
    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 LBBROWSER",
    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
    "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)",
    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SV1; QQDownload 732; .NET4.0C; .NET4.0E; 360SE)",
    "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)",
    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1",
    "Mozilla/5.0 (iPad; U; CPU OS 4_2_1 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8C148 Safari/6533.18.5",
    "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:2.0b13pre) Gecko/20110307 Firefox/4.0b13pre",
    "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:16.0) Gecko/20100101 Firefox/16.0",
    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11",
    "Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10"
]
# 品牌列表
def get_bank():
    response = session.get(url)#爬取网页
    response.encoding='gbk'
    response.html.render()
    banks = response.html.find('div.cartree>ul>li>h3')
    for bank in banks:
        #print(bank.text)
        #print(bank.html)
        bk = bank.text
        start = bk.find("(")
        end = bk.find(")")
        print(bk[0:start])
        print(bk[start+1:end])
    print(banks)

# 汽车品牌
def get_url():
    current_dir = os.path.abspath('.')#返回绝对路径
    print(current_dir)
    #print('1')
    file_name = os.path.join(current_dir, "\\bank.csv")
    print(file_name)
    response.encoding='gbk'
   # print('2')
    with open(file_name, 'wt', newline='')  as csvfile1:
        header = ['bank','count', 'url']
        writer = csv.writer(csvfile1)
        writer.writerow(header)
        #访问页面
        response = session.get(url)
        #print(response)
        #response.html.render()
        banks = response.html.find('.cartree ul li h3 a')
        #banks = response.html.find('#cartree')
        print(banks)
        print('1')
        for bank in banks:
            #print(bank.text)
            #格式化
            bk = bank.text
            print('2')
            print(bk)
            start = bk.find("(")
            end = bk.find(")")
            bank1 = bk[0:start]
            Num = bk[(start+1):end]
            url2 = url + bank.attrs.get("href", None)
            print(url2)

            save2csc(writer,bank1,Num,url2)
        #print(banks)
    csvfile1.close()
#
#写入CSV文件
def save2csc(writer,bank,num,url):
        header = ['bank','num' 'url']
        writer.writerow(header)
        csvrow1 = []
        csvrow1.append(bank)
        csvrow1.append(num)
        csvrow1.append(url)

        #writer.writerow(csvrow1)
        #print(csvrow1)
if __name__ == '__main__':
    print("开始处理")

    get_url()
    get_bank() 
    print("处理结束")

图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
行走蜗牛 2019-12-07 21:17
关注
先看下响应状态是不是200？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用requests 获取博客园每页内容时，为什么一直重复爬取第一页内容？感谢大佬 python 有问必答
2021-04-03 09:45

回答 4 已采纳问题出在urls构造上，第一页和后续网页的地址是不一样的，将这行改为：urls = [f'https://cnblogs.com/#p{page}' if page == 1 else f'https
python爬取并下载的文件为什么是空白且加载不出来？ python
2021-08-08 11:16

回答 2 已采纳你只是爬取了html网页，，怎么能让你运行人家的网页呢你说的加载不出来那是肯定的这个样子应该你只是爬了个外壳，css和js都不能用了，所以背景是白的，按钮都是没有样式的如果明白了，点击右上角给个采纳哦
为什么$ request-> get（）返回null？ laravel php
2014-12-14 01:55

回答 1 已采纳 There's currently a bug in Laravel where $request->get() only works for actual GET and POST dat
python爬虫使用 requests-html爬取网页信息以及常用方法
2020-07-21 10:34

瑶山的博客使用 from requests_html import HTMLSession # 获取请求对象 session = HTMLSession() sina = session.get('https://news.sina.com.cn/') sina.encoding = 'utf-8' print(sina.text) 常用方法：获取a链接 ...
python在post请求下爬取数据，返回的值为什么为空？ python
2019-05-29 17:34

回答 6 已采纳是因为你给的数据不足够，我刚才打开你的网站试了一下。 # header中必须有以下数据 ![图片说明](https://img-ask.csdn.net/upload/201905/30/1559
pycharm爬取的内容显示空白 python
2021-04-13 21:35

回答 2 已采纳查看网页源代码可以发现这是动态加载的，通过这样根本爬取不到信息，可以考虑使用selenium模块试试
SpringBoot获取vue端的json不为空但 RequestBody的实体为空？？？ intellij-idea java spring 有问必答
2021-04-24 01:08

回答 5 已采纳 axios默认带的json格式,你回传的数据有问题。这个全是小写，这个驼峰命名，映射不到了。所以应该把前端 userphone改成 userPhone,userpass改成userPass
python爬取页面元素内内容_python爬虫使用 requests-html爬取网页信息以及常用方法...
2020-12-04 14:54

weixin_39977642的博客目录安装使用常用方法：requests-html获取a链接获取img链接操作列表两种写法python处理数据常用方法数组追加obiect转str类型arr转字符串->(仅限['xxxxxxxxxxxx'])获取标签下文本自定义保存页面图片字符串去空格...
如何有效的在爬取网站时输入邮编？ html python 爬虫
2022-05-30 11:04

回答 1 已采纳就两种方式啊，要么使用页面爬取要么通过请求接口的方式爬取，当然请求接口的方式速度是最快的，但是太频繁容易被检测出事爬虫，那就把爬取的速度稍微放慢一点，中间设置一个等待时间，尽量模拟是人的操作，还有就是
谷歌浏览器抓包请求头中的sec-ch-ua是什么意思? html5 python
2021-03-01 17:45

回答 2 已采纳 sec-ch-ua可以理解用来替代user-agent的，用sec-ch-ua可以防止泄露浏览器详细信息
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
Python实战系列-爬取网页内容
2022-11-07 05:00

Web3&Basketball的博客 Python实战-爬取网页内容打印内容：
request.getParameter() 获取post为空的情况。 java 前端
2022-05-11 19:10

回答 4 已采纳写法错了，要把this.去掉。不然接收不到的。 package com.jgdabc.web; import com.jgdabc.pojo.Brand; import com.jgdabc
Python爬虫(1)------爬取网站图片
2018-05-04 21:50

Exler_yz的博客使用 urlib库进行爬取内容熟悉爬虫首先对百度进行爬取 # -*- coding: utf-8 -*- import urllib.request url = 'http://www.baidu.com' resp = urllib.request.urlopen(url) print(resp.read()) 使用...
Python网络爬虫---爬取CSND博客首页信息实战
2019-03-09 13:42

ElegantCodingWH的博客 Python之爬取CSND博客 1.进入csdn博客首页，点击鼠标右键，点击查看网页源代码，然后，在源代码网页中按ctrl + f键，会出现搜索框。 2.在博客首页中复制一些新闻的标题，然后在搜索框中搜索复制的标题，找到搜索到...
没有解决我的问题, 去提问

悬赏问题

¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮

为什么用request-html爬取的内容为空？

1条回答 默认 最新

悬赏问题

1条回答默认最新