一个python正则表达式匹配问题

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

def getDest(html):
//some code
return

html = getHtml("http://www.weather.com.cn/weather/101280101.shtml")
print getDest(html)

我想通过上面的代码抓取html里的以下数据，并输出到控制台，主要是天气和温度

图片说明

因为之前没学过python，函数getDest（）查了资料半天都没有写出来，求各位给个可用的代码

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
NOTHING-BLOG 2016-05-03 15:33
关注
给你个亲测可用的

import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getDest(html): return re.findall(r'<h1>(?P<date_str>[^<]*)</h1>.*?<p title="[^"]*" class="wea">(?P<weather>[^<]*)</p>.*?<i>(?P<temperature>\d+[^<]+)</i>', html, re.S) for each in getDest(getHtml("http://www.weather.com.cn/weather/101280101.shtml")): print each[0], each[1], each[2]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python正则表达式匹配图片 python
2021-03-28 22:00

回答 6 已采纳 1、 url='您想爬的网址' head={ 'user_agent':'需要你使用的浏览器的请求头' } page_data=requests.get(url=url,headers=h
请问Python正则表达式如何匹配连续的四位数字 python 有问必答
2022-04-29 12:38

回答 5 已采纳题中年份后面表示日月最多6个字符，试试如下代码： import re s=['新书/20200412/价格22.6元','旧书1/2010.3/价格10.5元','旧书2/2008-3-5/价格8.8
Python正则表达式匹配电话 python 正则表达式爬虫
2021-09-13 15:23

回答 1 已采纳 import pyperclip text = str(pyperclip.paste()) # 将最近一次复制的内容转换为字符串 import re regex = re.compile('(
Python正则表达式匹配数字和小数的方法
2021-01-20 05:29

以上所述是小编给大家介绍的Python正则表达式匹配数字和小数的方法,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对软件开发网网站的支持！如果你觉得本文对你有...
关于Python正则表达式的问题 python 正则表达式
2018-02-02 11:25

回答 3 已采纳 ^[abc].* 看看方括号的用法
python 正则表达式匹配网址 python 正则表达式
2022-09-10 23:58

回答 1 已采纳 import re res = re.findall('链接：(.*?)提取码：([A-Za-z0-9]{4})', string, re.S) print(res)
用PYTHON的正则表达式匹配不到目标 python
2020-12-29 16:16

回答 2 已采纳把点替换成 \.
Python正则表达式匹配日期与时间的方法
2021-01-20 06:01

下面给大家介绍下Python正则表达式匹配日期与时间 #!/usr/bin/env python # -*- coding: utf-8 -*- __author__ = 'Randy' import re from datetime import datetime test_date = '他的生日是2016-12-12 14:34,是个...
python正则表达式问题 python
2021-08-26 12:52

回答 1 已采纳 ^:匹配串开头$:匹配结尾+?*指的都是左边的单元[\d]+:匹配数字-?[\d]+:匹配数字,前面可以带有负号-?[\d]+(.[\d]+)?:匹配数字,后面可以带小数^$:匹配空串
python正则表达式匹配中文字符后面手机号码问题 python 正则表达式
2022-11-15 00:42

回答 2 已采纳你这里使用了^字符，这个表示从字符开头开始匹配，所以开头不是1[3-9]的都匹配不上
正则表达式匹配不包含某个字符串的字符串 python 正则表达式
2021-03-07 09:46

回答 2 已采纳。。。 import re l = [] res = re.findall('ABC.*?BCD', r'ABC/dABC/213BCD/sfoajs/ABC/dddd/BCD') fo
python使用正则表达式匹配字符串开头并打印示例
2020-10-20 16:01

主要介绍了python使用正则表达式匹配字符串开头并打印的方法,结合实例形式分析了Python基于正则表达式操作字符串的相关技巧,需要的朋友可以参考下
Python 正则表达式匹配字符串中的http链接方法
2021-01-20 04:37

利用Python正则表达式匹配字符串中的http链接。主要难点是用正则表示出http 链接的模式。 import re pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*,]|(?:%[0-9a-fA-F][0-9a-fA-F]))+') #...
Python正则表达式匹配HTML页面编码
2020-09-22 06:51

主要介绍了Python正则表达式匹配HTML页面编码,本文直接给出代码和匹配实例,需要的朋友可以参考下
Python正则表达式(一看就懂)
2022-03-30 19:58

练习时长两年半的Programmer的博客今天来发一下python正则表达式，其实这个也是比较简单的什么是正则表达式(⊙_⊙) 目前越来越多的网站、编辑器、编程语言都已支持一种叫“正则表达式”的字符串查找“公式”，有过编程经验的同学都应该了解正则...
没有解决我的问题, 去提问

悬赏问题

¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥15 stable diffusion
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误

一个python正则表达式匹配问题

3条回答 默认 最新

悬赏问题

3条回答默认最新