python3爬虫，用正则怎么把重复标签下的内容分别拿出来？

python爬虫（pycharm），用的正则。怎么把重复标签下的内容分别拿出来

re.findall(r'.*?[2]', target_r.text) 我这样写返回来一个空表

[]

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-HGJ 2021-11-28 11:27

关注

#使用正则 '<td>(.*)</td>',即可获取所有td标签下的文本内容。
import requests
import re
url='http://cba.sports.sina.com.cn/cba/stats/teamrank/'
res=requests.get(url)
res.encoding=res.apparent_encoding
result=re.findall('<td>(.*)</td>',res.text)
print(result)

#['1', '12', '1', '92.30%', '6胜0负', '6胜1负', '107.69', '92.77', '2', '11', '2', '84.60%', '5胜1负', '6胜1负', '101.62',...

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

python3爬虫，用正则怎么把重复标签下的内容分别拿出来？ pycharm python 有问必答爬虫
2021-11-28 09:52

回答 2 已采纳 #使用正则 '<td>(.*)</td>',即可获取所有td标签下的文本内容。 import requests import re url='http://cba.sports
关于python爬虫利用正则表达式爬取不到内容的问题 python 数据挖掘机器学习正则表达式
2019-10-18 08:20

回答 3 已采纳爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种： ``` from lxml import etree # 解析页面的模块 html = etree.HTML
python爬虫，当正则表达式无法匹配，怎么输出空字符 python 有问必答正则表达式爬虫
2021-09-01 16:19

回答 3 已采纳使用try except环绕即可
python3爬虫之入门基础和正则表达式
2020-10-23 12:45

主要介绍了python3爬虫之入门基础和正则表达式的相关资料,需要的朋友可以参考下
python 爬虫正则表达式打印遇到问题 python 正则表达式爬虫
2021-12-30 23:54

回答 2 已采纳 ulrs = re.findall('<img src="(.*?)" alt=".*?">', html) 改成这样就行了，有帮助的话采纳一下哦！谢谢！
Python爬虫正则表达式 python
2022-07-22 09:38

回答 3 已采纳
关于#python网络爬虫, 正则表达式 , html规则#的问题： python 正则表达式爬虫
2022-01-04 18:47

回答 2 已采纳 #导入包 import requests import re #请求网址 url = "https://www.vmgirls.com/18236.html" headers = {'User-A
python爬虫使用正则爬取网站的实现
2020-09-16 10:54

主要介绍了python爬虫使用正则爬取网站的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
Python爬虫能不能用正则表达式爬取学历部分？ python 爬虫
2022-09-25 14:35

回答 2 已采纳你好，这种HTML结构一般用xpath匹配，对于js般用正则表达式匹配，如果非要用正则表达式匹配HTML一般用：开头+（.*?）+结尾，括号里面的内容就是你要匹配的
python爬虫正则表达式 python 有问必答爬虫
2022-06-04 14:28

回答 3 已采纳可以这样写，示例： import pandas as pd df=pd.DataFrame({'number':[1,2,3,4],'value':['123人','456万人','789万','']
python正则表达式怎么提取下面所示的内容？ python 正则表达式爬虫
2021-12-07 08:48

回答 1 已采纳原网页完全可以使用xlml之类的把字符串的源码转换为Element对象，然后用xpath之类的去解析，大概的代码应该是： _ = etree.HTML(text) data_list = _.xpat
python爬虫；正则表达式爬虫
2023-05-31 14:45

基于python正则表达式对某旧书网的书籍信息爬虫，想买便宜的书，折扣多的书，一看便知。再也不用翻来翻去的找资源了，一看便知道了。本文简单用了正则表达式去获取书的作者，名称，价格，折扣力度等基本信息，方便...
python中要提取一部分内容，想问下正则怎么匹配 python 有问必答爬虫
2021-09-30 11:45

回答 1 已采纳可以匹配http:// 加空格。http://(.*)[\s] 或者直接spilt[' '].
Python爬虫之正则表达式
2022-03-10 15:21

姜小孩.的博客 Python正则表达式（爬虫学习内容之一
Python爬虫之正则表达式基本用法实例分析
2020-12-25 11:47

本文实例讲述了Python爬虫之正则表达式基本用法。分享给大家供大家参考，具体如下：一、简介正则表达式，又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法（英语：Regular Expression，在代码中常...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月28日

悬赏问题

¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥20 BAPI_PR_CHANGE how to add account assignment information for service line
¥500 火焰左右视图、视差（基于双目相机）
¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)

python3爬虫，用正则怎么把重复标签下的内容分别拿出来？

python爬虫（pycharm），用的正则。怎么把重复标签下的内容分别拿出来

re.findall(r'.*?[2]', target_r.text) 我这样写返回来一个空表

[]

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新