用Python爬取智慧树问题时，没办法入到soup.find_all（）的for循环中

现在需要爬取智慧树（需要登陆）网站上的问题内容和学生的回答

用Python爬取出现了一系列的问题

首先是从网页中复制的cookie在粘贴到他处的时候cookie貌似被编译了（复制前是一串字符，复制后出现了括号，出现了该账号的昵称，以至于我没办法从代码里加入cookie）

其次存在一个问题就是无法进入for循环，个人觉得有可能是两个方面出了问题，一个方面是该网页大概需要动态爬取，另一个方面可能是cookie的原因以至于无法登录进去

import sqlite3
from bs4 import BeautifulSoup  # 网页解析
import re  # 正则表达式，进行文字匹配
import urllib.request, urllib.error  # 指定URL，获取网页数据
import xlwt  # 进行表格操作

def main():
    baseurl = "https://qah5.zhihuishu.com/qa.html#/web/home/1000010562?role=2&recruitId=48192&VNK=575f239e"
    datalist = getDate(baseurl)


# 爬取网页
def getDate(baseurl):
    # 调用单个页面的内容
    url = baseurl
    html = askURL(url)  # 执行一次拿到一页内容
    # 2.解析数据
    soup = BeautifulSoup(html, "html.parser")
    for item in soup.find_all('div', class_="title"):  # 在一定的范围内进行查找
        #   for item in soup.find_all('span',class_="title"):
        item = str(item)
        print(item)


# 得到指定一个URL的网页内容
def askURL(url):     
    head = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"

    }
    # 换头，伪装
    request = urllib.request.Request(url, headers=head)
    html = ""
    try:
        response = urllib.request.urlopen(request)
        html = response.read().decode("utf-8")
    except urllib.error.URLError as e:
        if hasattr(e, "code"):
            print(e.code)
        if hasattr(e, "reason"):
            print(e.reason)
    return html


if __name__ == "__main__":
    main()
    print("爬取完毕")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
咕泡-Tony 2021-08-27 20:47
关注
因为你数据没有抓取到, 所以打印没输出

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用Python爬取智慧树问题时，没办法入到soup.find_all（）的for循环中 python
2021-08-27 15:54

回答 1 已采纳因为你数据没有抓取到, 所以打印没输出
python用selenium打开网址显示whitelabel error page python
2020-12-05 11:08

回答 1 已采纳红框位置这句话元素定位找不到位置，所以程序报错，改成下方我写的这句就可以成功了，成功后的效果见下图
智慧树页面内容seleuim无法点击 chrome python
2021-01-23 14:03

回答 1 已采纳用'start_maximized‘选项最大化浏览器窗口;更改定位元素方法,xpath,css_selector等;用EC.element_to_be_clickable()定位，用WebDriver
python智慧树视频爬取_python爬虫利器之requests库的用法(超全面的爬取网页案例)...
2020-12-30 14:41

weixin_39915171的博客 resp.request.headers 请求头内容 resp.cookie 获取cookie 到此这篇关于python爬虫利器之requests库的用法(超全面的爬取网页案例)的文章就介绍到这了,更多相关python爬虫requests库用法内容请搜索我们以前的文章或...
notepad++修改chromdrive.exe文件乱码应该如何修正？ chrome python selenium
2021-08-30 14:57

回答 4 已采纳 exe文件是二进制文件，nodepad打开肯定是乱码啊
css文件无法导入到html文件中
2016-05-15 13:15

回答 2 已采纳你的路径不对，前面加上.／或者加上你的项目名
哈希算法问题，大家看看我的算法有问题吗？
2016-05-27 15:18

回答 5 已采纳你要注意q可能会溢出，在q=q*33下面加一行q=q%HASH_SIZE
Python智慧树学习
2024-03-28 19:44

在Python的世界里，初学者首先要了解基础语法，如变量、数据类型（包括整型、浮点型、字符串、布尔型等）、运算符、流程控制（如if-else语句、for循环、while循环）、函数定义与调用、模块导入等。这些都是构建任何...
Rhyme Schemes
2017-04-28 06:39

回答 2 已采纳 http://blog.csdn.net/nvfumayx/article/details/12356847
输入为“任意进制+数值”，想输出十进制下该数的数值，但怎么也输出不对，求解答！ c++
2016-04-01 03:19

回答 1 已采纳有两个问题： 1.没有情况输入缓冲区 2.k=strlen(str1)-1才对，strlen是不计算'\0'的我在代码里注释了以下两处 ``` #include using names
智慧树知到python程序设计基础第三章答案_知到智慧树Python程序设计基础章节答案...
2021-01-14 07:52

weixin_39974223的博客知到智慧树Python程序设计基础章节答案更多相关问题【填空题】一个球形液滴在等温下与蒸气成平衡时,液相的压力气相的压力,液相的化学势 _ _ _ _ _ _ _ 气相的化学势。(选填 > , = , < )【单选题】30.( )是...
Python语言程序设计...生实践能力培养中的应用研究-韦韫韬.pdf
2023-12-20 19:26

"Python语言程序设计的混合式教学模式在学生实践能力培养中的应用研究" 本研究主要探讨了基于Python高级语言程序设计的“金课”建设分析，旨在解决传统的课堂教学模式下学生实践能力培养的问题。研究发现，混合式...
Python在财务中的应用智慧树知到课后章节答案2023年下浙江经贸职业技术学院.docx
2024-03-29 19:53

Python在财务中的应用智慧树知到课后章节答案2023年下浙江经贸职业技术学院.docx
python智慧树章节测试答案_知到智慧树_Python程序设计基础_答案章节单元测试答案...
2020-12-30 14:41

五彩夏天的博客去腐必须用高速机钻E. 病变组织颜色浅【单选题】危险环境下使用的手持电动工具的安全电压为( )A. 9V B. 12V C. 24V D. 36V【多选题】供应链合作伙伴之间如何防范合作风险( )A. 建立信任机制，培养企业间的信任B. ...
智慧树知到期末答案python_2020智慧树知到Python程序设计基础（山东联盟）期末答案...
2021-02-05 17:12

怪兽娃的博客参考答案如下智慧彩色多普勒血流成像...到P东联下列标题字标记中字号最大是( )。程础山Do you know why John didn't _______ at the party yesterday evening?序设3. He ran away from home because it was hard t...
智慧树python程序设计基础课后答案_智慧树知到Python程序设计基础作业题库答案...
2020-12-21 23:07

weixin_39893205的博客 [单选] 教师在游戏中与幼儿扮演同一个角色，以自己游戏的动作、角色的语言和对角色的态度来启发诱导幼儿，这是()。[多选] 根据玩具自身的内部结构，玩具可分为()。[单选] 人格的()是指人的思想感情和行为具有跨时间...
python爬虫requests.getcookie_python爬虫利器之requests库的用法(超全面的爬取网页案例)...
2020-12-17 18:39

weixin_39771775的博客 resp.request.headers 请求头内容 resp.cookie 获取cookie 到此这篇关于python爬虫利器之requests库的用法(超全面的爬取网页案例)的文章就介绍到这了,更多相关python爬虫requests库用法内容请搜索脚本之家以前的文章...
python智慧树判断题_智慧树知到_大数据分析的python基础_判断题答案
2021-01-14 14:12

牛兆河的博客 智慧树知到_大数据分析的python基础_判断题答案答案：更多相关问题强心苷中毒先兆症状A．一定次数的早搏B．窦性心律低于60次／minC．视色障碍D．房室传导阻滞E．室性心动强心苷在临床上可用于治疗A．心房纤颤B．心房...
Python语言与经济大数据分析智慧树知到课后章节答案2023年下上海财经大学.docx
2024-03-29 19:53

Python语言与经济大数据分析智慧树知到课后章节答案2023年下上海财经大学.docx
智慧树大数据分析的python_知到智慧树_大数据分析的python基础_答案完整
2020-12-10 14:12

weixin_39786617的博客【单选题】下列网页设计相关术语中描述网址的术语是( )。【多选题】发动分娩的机理主要包括：( )肾门的体表投影在竖脊肌内侧缘与第12肋的夹角【多选题】汽车后市场电子商务：指卖家和买家通过互联网/移动互联网的...
没有解决我的问题, 去提问