在爬虫上遇到问题，p标签

有没有会爬虫的友友，教一下我怎么用xpath爬p标签
我用的这个不想：
lastpage = content1.xpath('//span[@class="tit_name"]//p')

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-05 13:21
关注
引自免费微信小程序：皆我百晓生

当然可以，但我需要您先提供一些关于您的环境和需求的信息，例如使用的编程语言、网站结构以及您想要爬取的具体信息。这样我才能更准确地为您提供帮助。

不过，我可以给您一个基础的Python示例，这是一个使用CSS选择器来爬取指定标签下的所有文本的简单示例。这个例子不会涉及到人工智能，也不会涉及到特定网页上的特定P标签。

from bs4 import BeautifulSoup def get_p_tags(url): soup = BeautifulSoup(url, 'html.parser') p_tags = soup.select('.news_item p') return p_tags url = "https://example.com" p_tags = get_p_tags(url) for tag in p_tags: print(tag.text.strip())

如果您需要解决的问题是关于如何使用XPath来爬取特定的HTML元素，或者有其他具体的需求，欢迎您再次提出，我会尽力提供帮助。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

后端领域爬虫在电商平台竞品数据采集中的策略
2025-07-08 23:26

大厂资深架构师的博客竞争对手的新款手机定价是否比你低？同款商品在不同平台的销量差距有多大？竞品的用户评论里最常提到的"槽点"是什么？这些问题的答案，都藏在电商...本文的范围是：聚焦后端爬虫技术在电商竞品数据采集中的核心策略。
Python爬虫入门8：BeautifulSoup获取html标签相关属性
2021-01-30 10:17

LaoYuanPython的博客本节介绍了BeautifulSoup对象的主要属性，通过这些属性可以访问特定标签和内容。
Python爬虫开发学习全教程第二版，爆肝十万字【建议收藏】
2021-10-17 13:35

五包辣条！的博客大家好，我是辣条。上次整理的爬虫教程反响不错，但是还是有小伙伴表示不够细致，今天带了升级版，全文很长，建议先收藏下来。一、爬虫基础爬虫概述 ... 了解爬虫的概念 ... 原则上,只要是客户端(浏
2021-11-03大数据学习日志——数据埋点+网络爬虫——后端开发入门
2021-11-03 19:35

王络不稳定的博客由于咱们的静态服务器和动态服务器不在一个端口上，因此会涉及跨域访问问题。暂时的办法是设置允许跨域访问下载flask_cors pip install flask-cors 设置允许跨域访问 import json import pymysql from flask import...
python爬虫面试题集锦及答案
2022-09-18 19:16

AudiA6LV6的博客低成本：分布式存储系统的自动容错、自动负载均衡的特性，允许分布式存储系统可以构建在低成本的服务器上。另外，线性的扩展能力也使得增加、减少服务器的成本低，实现分布式存储系统的自动运维。
从入门到精通：pyquery在Python爬虫中的全方位应用
2025-11-11 06:50

程序员威哥的博客 pyquery的核心价值是“用极简的jQuery语法，实现高效的HTML解析”——既降低了爬虫开发的学习成本，又保证了解析性能，是静态网页数据提取的优选工具。
爬虫与反爬虫技术简介
2022-09-20 16:48

AudiA6LV6的博客爬虫分为通用爬虫和聚焦爬虫两大类，前者的目标是在保持一定内容质量的情况下爬取尽可能多的站点，比如百度这样的搜索引擎就是这种类型的爬虫，如图 1 是通用搜索引擎的基础架构：首先在互联网中选出一部分网页，以...
Python 实现简单的爬虫
2022-01-06 16:59

Java进阶营菌的博客 # 定位到第一个标签上 tr = bs.find_all(‘tr’)[2:] # 在conMidtab里面找，tr标签并从第3个标签开始保存 for i in tr: td = i.find_all(‘td’) # 循环找代码中的所有td标签 city_td = td[0] # 找所有的td标签,并...
实战深度解析：基于Python构建悉尼招聘信息分类网站智能爬虫
2025-08-07 10:29

猫敷雪的博客本文将循着“项目背景、需求分析、技术实现、难点攻克、总结展望”的论文式结构，通过详尽的代码解读和逻辑分析，为您呈现一个集网页解析、API请求、反爬虫策略、数据清洗和智能优化于一体的综合性爬虫解决方案。
vue打开后端html文件,VUE渲染后端返回含有script标签的html字符串示例
2021-06-13 04:23

DGGs的博客 VUE渲染后端返回含有script标签的html字符串示例在接入支付宝支付模块的时候，支支返回的是一个form串，细看一下还有一个script标签，如何将其渲染出来给大家分享一下经验。注意点：不能在当前页面追加任何元素例如...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月5日

在爬虫上遇到问题，p标签

3条回答 默认 最新

问题事件

3条回答默认最新