爬取豆瓣阅读页面代码返回出现问题

我爬取豆瓣阅读其中一个子网页，返回的内容不太正常，跟页面源码不同，进行不了页面解析，请问这个是怎么回事呢。
hash_url = 'https://read.douban.com/category/1?sort=hot&page=1%27
resp = requests.get(hash_url, headers=headers)
print(resp.text)
打印出现
Ark.kindTree = [{"children": [{"children": [], "id": 501, "name": "\u8a00\u60c5\u5c0f\u8bf4"}, {"children": [], "id": 532, "name": "\u5973\u6027\u5c0f\u8bf4"}, {"children": [], "id": 508, "name": "\u60ac\u7591\u5c0f\u8bf4"}, {"children": [], "id": 506, "name": "\u5e7b\u60f3\u5c0f\u8bf4"}, {"children": [], "id": 505, "name": "\u79d1\u5e7b\u5c0f\u8bf4"},
等内容，请问是网站反爬策略吗

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

cjh4312 2023-09-02 19:26

关注

需要这个吗


import requests
import pandas as pd
headers = {

    'Referer': 'https://read.douban.com/category/1?sort=hot&page=1%27',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36',
}

json_data = {
    'sort': 'hot',
    'page': 1,
    'kind': 1,
    'query': '\n    query getFilterWorksList($works_ids: [ID!]) {\n      worksList(worksIds: $works_ids) {\n        \n    \n    title\n    cover(useSmall: false)\n    url\n    isBundle\n    coverLabel(preferVip: true)\n  \n    \n  url\n  title\n\n    \n  author {\n    name\n    url\n  }\n  origAuthor {\n    name\n    url\n  }\n  translator {\n    name\n    url\n  }\n\n    \n  abstract\n  authorHighlight\n  editorHighlight\n\n    \n    isOrigin\n    kinds {\n      \n    name @skip(if: true)\n    shortName @include(if: true)\n    id\n  \n    }\n    ... on WorksBase @include(if: true) {\n      wordCount\n      wordCountUnit\n    }\n    ... on WorksBase @include(if: false) {\n      inLibraryCount\n    }\n    ... on WorksBase @include(if: false) {\n      \n    isEssay\n    \n    ... on EssayWorks {\n      favorCount\n    }\n  \n    \n    \n    averageRating\n    ratingCount\n    url\n    isColumn\n    isFinished\n  \n  \n  \n    }\n    ... on EbookWorks @include(if: false) {\n      \n    ... on EbookWorks {\n      book {\n        url\n        averageRating\n        ratingCount\n      }\n    }\n  \n    }\n    ... on WorksBase @include(if: false) {\n      isColumn\n      isEssay\n      onSaleTime\n      ... on ColumnWorks {\n        updateTime\n      }\n    }\n    ... on WorksBase @include(if: true) {\n      isColumn\n      ... on ColumnWorks {\n        isFinished\n      }\n    }\n    ... on EssayWorks {\n      essayActivityData {\n        \n    title\n    uri\n    tag {\n      name\n      color\n      background\n      icon2x\n      icon3x\n      iconSize {\n        height\n      }\n      iconPosition {\n        x y\n      }\n    }\n  \n      }\n    }\n    highlightTags {\n      name\n    }\n    ... on WorksBase @include(if: false) {\n      fanfiction {\n        tags {\n          id\n          name\n          url\n        }\n      }\n    }\n  \n    \n  ... on WorksBase {\n    copyrightInfo {\n      newlyAdapted\n      newlyPublished\n      adaptedName\n      publishedName\n    }\n  }\n\n    isInLibrary\n    ... on WorksBase @include(if: false) {\n      \n    fixedPrice\n    salesPrice\n    isRebate\n  \n    }\n    ... on EbookWorks {\n      \n    fixedPrice\n    salesPrice\n    isRebate\n  \n    }\n    ... on WorksBase @include(if: true) {\n      ... on EbookWorks {\n        id\n        isPurchased\n        isInWishlist\n      }\n    }\n    ... on WorksBase @include(if: false) {\n      fanfiction {\n        fandoms {\n          title\n          url\n        }\n      }\n    }\n    ... on WorksBase @include(if: false) {\n      fanfiction {\n        kudoCount\n      }\n    }\n  \n        id\n        isOrigin\n        isEssay\n      }\n    }\n  ',
    'variables': {},
}

response = requests.post('https://read.douban.com/j/kind/', headers=headers, json=json_data)
data=pd.DataFrame(response.json()['list'])

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

doubanscrapy:CSDN博客scrapy爬取豆瓣电影的开源代码，使用scrapy框架爬取豆瓣电影
2021-03-23 03:55

这个项目的基础是Python编程，Python因其简洁的语法和丰富的库资源而成为爬虫开发的首选语言。在该项目中，会涉及到如requests库进行HTTP请求、BeautifulSoup库解析HTML、以及可能的pandas库用于数据处理和分析。 *...
豆瓣电影口碑榜爬取[代码]
2025-11-16 09:26

本文详细介绍了利用Python编程语言，结合requests库与lxml库，从豆瓣电影网站抓取一周内电影口碑榜信息的技术流程。通过编写爬虫程序，作者演示了如何对网站进行HTTP请求，并对返回的HTML文档进行解析，最终成功提取...
Python爬取豆瓣电影数据[可运行源码]
2025-11-15 09:13

本文将详细介绍如何利用Python语言来爬取豆瓣电影的相关数据，并对所涉及的技术点进行深入剖析。首先，需要准备几个关键的Python模块：requests模块用于发起网络请求，BeautifulSoup模块用于解析和过滤网页数据，而...
Python爬虫，用xpath爬取豆瓣电影！
2024-11-20 15:40

Python_trys的博客 response.concent:返回的是一个原生的字符串，就是从网页上抓取下来的，没有经过解码的字符串，是bytes类型。response.text:返回的是一个经过解码后的字符串，是str（unicode）类型。2.获取ul、li下的 ‘title’、...
Go-Golang爬虫爬取豆瓣电影Top250
2019-08-14 03:33

Go语言的错误处理机制是通过返回错误值来实现的，我们需要在每一步操作后检查并处理可能出现的错误。 7. **测试**：使用Go语言的`testing`包，可以为爬虫编写单元测试，确保各个功能模块的正确性。这有助于找出...
爬虫案例3 BeautifulSoup 爬取豆瓣电影排行榜 (1).pdf
2025-06-23 09:38

本案例以豆瓣电影排行榜为例，详细讲解了使用Python编程语言中的BeautifulSoup库进行网页数据爬取的基本流程和核心用法。首先，我们明确了目标网页为豆瓣电影top250排行榜，其URL为...
Java爬取豆瓣电影数据
2024-05-03 06:46

2401_84153158的博客首先我们在entity包中建立实体对象，字段为豆瓣电影的基本信息（有些信息是详情页面的信息）。 Movie实体类。 import javax.persistence.*; @Entity public class Movie { private Integer id; private double rate...
【python】爬取豆瓣电影排行榜Top250存储到Excel文件中【附源码】
2024-01-05 14:49

Yan-英杰的博客爬取豆瓣电影排行榜Top250存储到Excel文件中
使用网络爬虫爬取豆瓣电影网站的数据
2024-10-21 15:27

曼亿点的博客本任务将带领大家编写Python程序，利用requests库，爬取豆瓣电影Top250网站的数据。一、网络爬虫概述网络爬虫又称为网络蜘蛛或网络机器人，是一个用来实现自动采集网络数据的程序。如果将互联网比作一张蜘蛛网...
【Python爬虫】新手入门案例教学（一）：爬取豆瓣电影排行有关信息
2021-10-22 15:42

魔王不会哭的博客前言本文的文字及图片来源于...爬取豆瓣Top250排行电影信息电影名字导演、主演年份、国家、类型评分、评价人数电影简介二、发送请求 Python中的大量开源的模块使得编码变的特别简单，我们写爬虫第一个要了解的
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月2日

爬取豆瓣阅读页面代码返回出现问题

2条回答 默认 最新

问题事件

2条回答默认最新