python beautifulsoup 解析html无法获得全部html代码

import urllib.request
import urllib.parse
from bs4 import BeautifulSoup
import re
import sys

def main():
    haltsParse()

def haltsParse():
    answer = []
    url = "https://www.nasdaqtrader.com/trader.aspx?id=TradeHalts"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36"
    }
    request = urllib.request.Request(url=url, headers=headers)
    response = urllib.request.urlopen(request)
    html = response.read().decode('utf-8')
    bs = BeautifulSoup(html, "html.parser")
    list = bs.find_all("div",{"id":"divTradeHaltResults"})
    element = list
    print(html)

if __name__=="__main__":
    main()

以上是我的python代码。我想要爬取的网页链接为https://www.nasdaqtrader.com/Trader.aspx?id=TradeHalts

在这个网页里面，我想要爬一个表格里面的数据，表格为

我按F12得到的网页html代码中，表格的数据是存在的，下图里面的tbody里面就是表格数据

但是当我运行我的python代码，python给我的反馈为这个div里面是空的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
天际的海浪 2021-01-04 18:51
关注
因为这个div里面的内容是用ajax动态加载的，
而用request获取的是网页的源代码（就是“右键菜单->查看网页源代码”的内容），不包含ajax动态加载的内容。
所以要找到ajax加载数据的请求https://www.nasdaqtrader.com/RPCHandler.axd
直接获取https://www.nasdaqtrader.com/RPCHandler.axd的数据

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

python beautifulsoup 解析html无法获得全部html代码 python
2021-01-04 15:04

回答 3 已采纳因为这个div里面的内容是用ajax动态加载的，而用request获取的是网页的源代码（就是“右键菜单->查看网页源代码”的内容），不包含ajax动态加载的内容。所以要找到ajax加载数据的
Python爬虫 BeautifulSoup解析网页爬取内容为None python 有问必答
2021-08-31 14:07

回答 2 已采纳你抓的频率太快，IP被墙了
Beautifulsoup解析网页获取到的标签属性缺失 python 爬虫
2023-04-23 14:32

回答 1 已采纳 soup = BeautifulSoup(html_doc, 'html.parser', from_encoding='utf-8')
Python利用BeautifulSoup解析Html的方法示例
2020-09-21 05:39

BeautifulSoup是python的一个库，最主要的功能是从网页...下面这篇文章主要给大家介绍了关于Python利用BeautifulSoup解析Html的方法示例，文中通过示例代码介绍的非常详细，需要的朋友们下面跟着小编来一起学习学习吧。
使用BeautifulSoup或golang colly解析HTML时遇到问题 python
2018-07-12 07:23

回答 1 已采纳 It looks to me like the HTML is actually commented out, so that's why BeautifulSoup can't find it.
python爬取github代码时无法获得作者名和库名 github python 爬虫
2022-11-13 00:01

回答 2 已采纳你这就没获取到信息。肯定得不到需要cookie信息的。否则你得不到信息
Python获取div下内容 python 爬虫
2022-04-14 10:52

回答 1 已采纳一个取巧的方法： # span后面的懒得写了。。正则表达式的前后缀你可以改动一下 list_match = re.findall(r'<span...>(.*?)</span>
Python下利用BeautifulSoup解析HTML的实现
2020-12-23 02:39

Beautiful Soup 是一个可以从 HTML 或 XML 格式文件中提取数据的 Python 库，他可以将HTML 或 XML 数据解析为Python 对象，以方便通过Python代码进行处理。文档环境 Centos7.5 Python2.7 BeautifulSoup4 ...
关于python爬虫中beautifulsoup4与正则表达式的运用问题！ python
2020-06-21 21:50

回答 1 已采纳 soup.find_all(href=re.compile("view")) soup.查找所有（href属性里面含有view关键字）的结果有时间看看RE模块的用法
网页内容解析，python json python
2023-03-12 11:09

回答 2 已采纳这都直接返回json信息了。
为什么python代码正确，但是打印不出来值呢 python
2021-07-30 20:21

回答 1 已采纳你自己看网站，它网站最高温就是-
Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】
2020-09-19 12:00

主要介绍了Python HTML解析器BeautifulSoup用法,结合实例形式详细分析了第三方库BeautifulSoup实现的爬虫解析器功能具体操作技巧,需要的朋友可以参考下
关于#python#的问题：请问怎么用beautifulsoup来解析爬取书名之类的信息呢 python 有问必答
2021-10-06 01:48

回答 2 已采纳你把完整的代码用代码段以文本的形式发一下看看你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新
Python使用BeautifulSoup库解析HTML基本使用教程
2021-01-20 04:58

BeautifulSoup是Python的一个第三方库，可用于帮助解析html/XML等内容，以抓取特定的网页信息。目前最新的是v4版本，这里主要总结一下我使用的v3版本解析html的一些常用方法。准备 1.Beautiful Soup安装为了能够对...
python爬虫beautifulsoup解析html方法
2021-01-21 15:19

用BeautifulSoup 解析html和xml字符串实例： #!/usr/bin/python # -*- coding: UTF-8 -*- from bs4 import BeautifulSoup import re #待分析字符串 html_doc = <html> <head> <title>The ...
没有解决我的问题, 去提问

悬赏问题

¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测
¥88 python部署量化回测异常问题
¥30 酬劳2w元求合作写文章
¥15 在现有系统基础上增加功能
¥15 远程桌面文档内容复制粘贴，格式会变化
¥15 这种微信登录授权谁可以做啊
¥15 请问我该如何添加自己的数据去运行蚁群算法代码

python beautifulsoup 解析html无法获得全部html代码

3条回答 默认 最新

悬赏问题

3条回答默认最新