python爬虫爬取数据问题

我试着爬取一个网站的数据时，爬取的标题如下

我想要这个标题title，但是提取出来的内容含有html标签

广州&ldquo;1+9&rdquo;科技创新与<em>人</em><em>才</em>政策解读（七）&mdash;&mdash;产业领军<em>人</em><em>才</em>集聚工程政策

想问问有没有什么好的办法可以删去这些个html标签

试过使用正则匹配汉字，但是有些符号比如【】会丢失，且效率不高

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
无序繁星 2023-09-20 17:20
关注
使用BeautifulSoup库, pip install beautifulsoup4

from bs4 import BeautifulSoup html_text = '广州“1+9”科技创新与人才政策解读（七）——产业领军人才集聚工程政策' soup = BeautifulSoup(html_text, 'html.parser') text_without_tags = soup.get_text() print(text_without_tags) # 广州“1+9”科技创新与人才政策解读（七）——产业领军人才集聚工程政策
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬取网页数据并解析数据
2020-09-24 10:46

Python作为一门功能强大的编程语言，提供了丰富的第三方库用于网络爬虫的开发，例如requests用于发送网络请求，BeautifulSoup用于解析HTML文档等。网络爬虫的基本概念涉及到了其功能的广义性。它可以用于搜索引擎...
Python指南：六步教你如何使用python爬虫爬取数据
2024-09-19 10:02

WANGWUSAN66的博客不过没有js类语言基础也没关系，主要步骤就是，保留相同的部分就行，慢慢的试，总会对的。如上图所示，我们在找到想要爬取的页面部分的网页代码后，将鼠标放置于代码上，右键，copy到selector部分。
如何用六步教会你使用python爬虫爬取数据
2023-02-22 10:09

AI大模型学习教程的博客到此这篇关于如何用六步教会你使用python爬虫爬取数据的文章就介绍到这了,更多相关python爬虫爬取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！如果对Python感兴趣的话...
Python爬虫爬取漫画
2024-11-22 16:22

使用Python爬虫爬取漫画不仅能够帮助用户快速收集漫画资源，也能够为相关研究提供便利。 Python爬虫技术主要涉及网络请求、网页解析、数据存储等几个方面。在爬取漫画时，首先需要发送网络请求到目标漫画网站，获取...
Python爬虫爬取招聘数据和代码.zip
2020-05-07 10:50

这个压缩包“Python爬虫爬取招聘数据和代码.zip”提供了一个完整的解决方案，教你如何利用Python来爬取与Python编程语言相关的招聘信息。首先，我们来详细探讨Python爬虫的基础知识。Python之所以被广泛用于爬虫...
Python爬虫爬取智联招聘
2018-05-29 16:44

总结以上知识点，Python爬虫不仅可以用于简单地爬取网页内容，还可以进行复杂的数据分析和处理。随着编程技能的提升和对相关库工具的熟悉，可以开发出更加高效、智能的爬虫程序，用于解决实际问题。在进阶版中，作者...
python爬虫爬取百度百科页面.zip
2025-01-03 09:49

本次分享的“python爬虫爬取百度百科页面.zip”压缩包，就展示了如何利用Python语言以及相应的库来爬取和处理来自百度百科的信息。百度百科是中国最大的中文百科全书，其内容丰富、涵盖广泛，是爬虫技术学习者非常...
如何使用python爬虫爬取数据？python爬虫爬取数据的六个步骤
2023-09-20 10:54

苏卡不列-python的博客比如我们现在要爬取的是微博热搜页面，进入页面，按下F12，就会出现网页的js语言设计部分，找到网页上的Network部分，可以使用ctrl+r刷新一下页面。然后，我们浏览Name这部分，找到我们想要爬取的文件，鼠标右键，...
基于Python编程语言的水文数据爬取设计源码
2024-10-01 07:42

本项目所涉及的“基于Python编程语言的水文数据爬取设计源码”提供了一个高效且专业的解决方案，帮助相关人员快速、准确地收集和整理水文数据。项目源码由80个文件构成，其中包含大量的数据文件和配置文件，主要...
python爬虫爬取网页数据
2022-12-01 07:45

大模型扬叔的博客 python爬虫爬取网页数据
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月20日

python爬虫爬取数据问题

2条回答 默认 最新

问题事件

2条回答默认最新