采用BeautifulSoup库无法解析到网址信息，求解决方法

网址源码如下：

<span class="company-page-item-right cmpweb">
 <a target="_blank" href="http://www.gmgitc.com">www.gmgitc.com</a>
</span>

通过BS解析后，无法获取a标签内容

import requests
from bs4 import BeautifulSoup

intro_url = 'https://xinsanban.eastmoney.com/F10/CompanyInfo/Introduction/831039.html'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit\
            /537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'}
resp = requests.get(intro_url, headers=headers, timeout=1)
print（bs）
___________________________________________________________________________________________________
<li class="even">
<span class="company-page-item-left ">公司网址</span>
<span class="company-page-item-right cmpweb"/>
</li>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-天际的海浪 2021-10-20 00:39
关注
因为这个网页中的公司网址是通过js代码来动态更新的。
requests只能获取网页的静态源代码，动态更新的内容取不到。
对于动态更新的内容要用selenium 来爬取。

在页面上点击右键，右键菜单中选 "查看网页源代码"。

这样看到的才是网页的静态源代码。

可以看到这个网页的静态源代码中没有你需要的<a target="_blank" href="http://www.gmgitc.com">www.gmgitc.com</a>
说明该页面的内容是动态更新的，要用selenium 来爬取，比如：.

from selenium import webdriver import time from bs4 import BeautifulSoup driver = webdriver.Chrome() intro_url = 'https://xinsanban.eastmoney.com/F10/CompanyInfo/Introduction/831039.html' driver.get(intro_url) time.sleep(3) html = driver.page_source soup=BeautifulSoup(html,'lxml') req=soup.select('span.company-page-item-right.cmpweb')[0] print(req)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python爬虫beautifulsoup4常用的解析方法总结
2020-09-19 13:54

在Python的网络爬虫开发中，BeautifulSoup4是一个非常实用的库，用于解析HTML和XML文档。这篇总结将详细介绍BeautifulSoup4的一些常用解析方法，帮助开发者更高效地处理网页数据。首先，要使用BeautifulSoup4解析...
Python使用BeautifulSoup库解析HTML基本使用教程
2020-09-21 17:07

### Python使用BeautifulSoup库解析HTML基本使用教程 #### 概述在当今互联网时代，从网页上抓取数据成为了一项重要的技能。Python作为一种强大的编程语言，提供了多种库来实现这一目的，其中BeautifulSoup是最为...
爬虫专栏第五篇：Python BeautifulSoup 库全解析：从解析器到网页数据爬取实战
2024-12-03 21:05

同时，还阐述了解析器的常用方法以及 BeautifulSoup 提取数据的常用方法，最后以爬取淘宝网首页为例，一步步呈现利用该库进行网页数据爬取的完整流程，助力读者掌握 BeautifulSoup 在数据解析与爬取方面的运用。
python使用BeautifulSoup分析网页信息的方法
2020-09-22 07:04

另外，根据网页的不同，有的网站可能采用JavaScript动态生成内容，这种情况下，直接用urllib2可能无法获取到全部内容。在这些情况下，可以考虑使用Selenium等自动化测试工具，通过模拟浏览器行为来获取完整的页面...
【Python编程】基于Python的网络爬虫技术详解：爬虫架构与BeautifulSoup解析库的应用
2025-07-12 20:51

此外，文档还展示了urllib2实现网页下载的三种方式，并介绍了BeautifulSoup库的安装与使用，包括通过命令行安装、测试安装成功与否以及具体解析HTML文件的实例。适合人群：对Python有一定了解，想学习网络爬虫技术...
Python利用BeautifulSoup解析Html的方法示例
2020-09-21 05:39

### Python利用BeautifulSoup解析HTML的方法详解 #### 一、概述在现代Web开发与数据分析领域，数据抓取是一项重要的技能。对于Python开发者来说，BeautifulSoup是一个不可或缺的工具库，它能够帮助开发者轻松地从...
深入解析：使用Python BeautifulSoup库处理HTML文档
2024-06-28 20:16

在Python中，BeautifulSoup是一个功能强大的库，用于解析HTML和XML文档。它能够从复杂的HTML中提取数据，而且使用起来非常灵活和方便。本文将详细介绍如何使用BeautifulSoup库来解析HTML文档，包括库的安装、基本...
Python网页解析利器：BeautifulSoup使用指南
2024-09-23 15:26

本文将详细介绍如何在Python中使用BeautifulSoup进行网页解析，包括库的安装、基本用法、高级技巧以及最佳实践。 BeautifulSoup是Python中进行网页解析的强大工具。通过本文的介绍，你应该能够掌握BeautifulSoup的...
使用Python的BeautifulSoup库进行网页解析爬虫和数据提取.txt
2023-08-17 11:18

# 使用BeautifulSoup解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 提取网页的标题 title = soup.title.string # 提取所有链接的文本 links = [link.text for link in soup.find_all('a...
Python中的BeautifulSoup：从入门到实践
2024-11-24 10:48

Python中的BeautifulSoup是一个用于解析HTML和XML文档的库，它在数据科学和网页抓取领域有着广泛应用。BeautifulSoup能够将复杂的文档结构转换成Python对象树，简化了遍历和搜索文档树的过程。它的灵活性和易用性使...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月20日

采用BeautifulSoup库无法解析到网址信息，求解决方法

2条回答 默认 最新

问题事件

2条回答默认最新