一个python正则表达式匹配问题 3C

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

def getDest(html):
//some code
return

html = getHtml("http://www.weather.com.cn/weather/101280101.shtml")
print getDest(html)

我想通过上面的代码抓取html里的以下数据,并输出到控制台,主要是天气和温度

图片说明

因为之前没学过python,函数getDest()查了资料半天都没有写出来,求各位给个可用的代码

0

3个回答

你可以先用字符串查找来找到你关心的数据, 正则只是另一种语法。

0

给你个亲测可用的

import urllib
import re

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getDest(html):
    return re.findall(r'<h1>(?P<date_str>[^<]*)</h1>.*?<p title="[^"]*" class="wea">(?P<weather>[^<]*)</p>.*?<i>(?P<temperature>\d+[^<]+)</i>', html, re.S)

for each in getDest(getHtml("http://www.weather.com.cn/weather/101280101.shtml")):
    print each[0], each[1], each[2]
0

题主也可以尝试xpath

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
第10题 正则表达式匹配(动态规划)
题目描述:rnrn'.' Matches any single character.rn'*' Matches zero or more of the preceding element.rnrnThe matching should cover the entire input string (not partial).rnrnThe function prototype should be:r
算法设计与分析: 3-14 正则表达式匹配问题
3-14 正则表达式匹配问题nnnn问题描述nn许多操作系统采用正则表达式实现文件匹配功能。一种简单的正则表达式由英文字母、数字及通配符“ * ”和“?”组成。“?”代表任意一个字符。“ * ”则可以代表任意多个字符。 现要用正则表达式对部分文件进行操作。nn试设计一个算法,找出一个正则表达式,使其能匹配的待操作文件最多,但不能匹配任何不进行操作的文件。所找出的正则表达式的长度还应是最短的。nn数...
剑-正则表达式匹配(递归 + 动态规划)
题目描述:rnrn请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配。rnrnrn递归解法rnrnpublic static boolean isMatc
动态规划——正则表达式匹配
题目链接:http://www.lintcode.com/zh-cn/problem/regular-expression-matching/n参考资料:http://www.cnblogs.com/wuchaodzxx/p/5846284.html 【思路正确,但是伪代码写错了:字符串中的第j个字符的位置应该是j-1】n///////////////////动态规划n public bool
正则表达式匹配问题(暴力求解)
题目:预备知识:(1)正则表达式的概念是对字符串操作的逻辑公式,是事前定义好的一些特定的字符以及特定字符的组合。这里题目中的p就是正则表达式(字符模式)要判断s是否满足p的字符模式。正则表达式是描述了一种字符串匹配的模式,用来检查一个串中是否含有某种模式的子串,或者将匹配的子串替代又或者从里面取出符合某种模式的子串。所以并不是简单的看是否是子串的问题,例如:s=&quot;aaa&quot; p=&quot;aaaaa&quot;和s=...
String、动态规划——正则表达式匹配
题目描述:n请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配。n直接贴代码!public class Solution {n public b
正则表达式匹配----动态规划专题
文章目录一、题目信息1. 题目描述2. 说明3. 示例14. 示例25. 示例36. 示例47. 示例58. 题目来源二、题目解析1. 分析题意2. 动态规划2.1 思路2.2 状态转移方程2.3 复杂度分析2.4 代码实现3. 递归3.1 思路3.2 复杂度分析3.3 代码实现rn一、题目信息rn1. 题目描述rnrn给定一个字符串 (s) 和一个字符模式 ( p)。实现支持 . 和 * 的正则表达式匹...
python求解括号匹配的相关问题
这个在本科学习数据结构的时候已经接触很多了,主流的思想是借助栈的压入、弹出来进行匹配,至于python的话可以使用列表来完成这个操作,因为列表的append方法相当于栈的push方法,列表的pop方法相当于栈的pop方法。rn    主要的思路:rn    首先设置两个列表分别存放的是各种括号的开括号和闭括号,然后遍历给定的字符串,分如下几种情况:rn1.字符串首字符出现在闭括号列表中,直接结束,
算法#20--正则表达式匹配原理
本文不会介绍正则表达式的语法,重点介绍正则表达式匹配原理,算法实现。
【Leetcode】Python实现正则表达式匹配
给定一个字符串 (s) 和一个字符模式 (p)。实现支持 ‘.’ 和 ‘*’ 的正则表达式匹配。nn‘.’ 匹配任意单个字符。 n‘*’ 匹配零个或多个前面的元素。 n匹配应该覆盖整个字符串 (s) ,而不是部分字符串。nnnn说明:nnnns 可能为空,且只包含从 a-z 的小写字母。np 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。nn示例 1:nnnn输入:ns = &quot;a...
C++算法:正则表达式匹配------回溯+动态规划
题目:n给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘’ 的正则表达式匹配。’.’ 匹配任意单个字符’’ 匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。n说明:ns 可能为空,且只包含从 a-z 的小写字母。 p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。n示例 1:n输入: s = “aa” p = “a...
正则表达式匹配问题
#include "iostream"n#include "string"n#include "iomanip"n#include "fstream"nusing namespace std;/*n正则表达式可选字符集的排列顺序先为‘*’,‘?’,操作文件名序列中出现的所有字符按其频率递减的次序随后大体思路:n正则表达式为s,当前考察文件为fmatch(i, j)为s[1,i]与f[1,j]匹配情况
hdu 6170 正则表达式 dp
传送门rnrnrnrnTwo stringsrnTime Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others)rnTotal Submission(s): 463    Accepted Submission(s): 171rnrnrnrnProblem DescriptionrnrnGivin
python的正则表达式匹配问题
import rerntext=' 2009年国家司法考试试卷一--中华人民共和国司法部网站'rntest=re.compile(r' (\d\d\d\d年国家司法考试试卷[一二三四五])(.*)')rnprt=test.search(text)rnif prt:rn print prt.group(1)rnelse:rn print 'not search'rnrn新手刚开始学正则表达式,来问点白痴问题。rn我想输出 “2009年国家司法考试试卷一” 为什么这段代码输出结果是空白的,啥都没输出rn求解![img=https://forum.csdn.net/PointForum/ui/scripts/csdn/Plugin/001/face/49.gif][/img]
python正则表达式匹配问题
用python写了个提取网页的小程序,代码如下:rn[code=python]# encoding:UTF-8rnimport sysrnimport rernfrom urllib2 import Request, urlopen, URLError, HTTPErrorrnrndef get_packet(url):rn packet = urlopen(url)rn content = packet.read()rn return contentrndef get_data(packet):rn xiangmu = '~'rn tmp = re.search(r'
49.正则表达式匹配问题
问题描述:请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串&quot;aaa&quot;与模式&quot;a.a&quot;和&quot;ab*ac*a&quot;匹配,但是与&quot;aa.a&quot;和&quot;ab*a&quot;均不匹配已知:bool match(char* str, char* pattern)解法:利用递归思...
python 正则表达式-匹配规则
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 nPython 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 nre 模块使 Python 语言拥有全部的正则表达式功能。 ncompile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。 nre 模块也提供了与这些方法功能完...
剑指offer19:正则表达式匹配问题——递归与动态规划两种解法
剑指offer19:正则表达式匹配问题——递归与动态规划两种解法问题描述分析求解递归方法动态规划测试Main方法及测试用例输出结果n问题描述n请实现一个函数用来匹配包括‘.’和‘*’的正则表达式。模式中的字符‘.’表示任意一个字符,而‘*’表示它前面的字符可以出现任意次(包含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是...
正则表达式中跨行匹配问题
在学习Python写爬虫时用到正则表达式是必然的,因此有效掌握正则表达式这门神器会使我们爬虫工作如鱼得水,不过在成长为大神之前还是有很多弯路要走,希望自己一路打怪升级早日成为大神。 n 闲话少叙,今天写爬虫的时候发现要匹配一个跨很多很多行的内容,之前是(.+?)在手,爬虫我有,不过这次这个神匹配也不好使了,查了点资料,发现是(.)不能匹配跨行内容,ok,上利器,[\s\S]* or [\w\W]*
LeetCode10:正则表达式匹配问题
场景:nn最近上LeetCode刷题,碰到正则表达式匹配问题,描述如下:nn​nn分析:nn刷算法题本人一直遵循Kent Beck的三部曲:Make it work-&amp;gt;Make it right-&amp;gt;Make it fast 。nn首先,随机选取一个测试用例进行匹配模拟操作,你会发现你会很自然地采用逐个字符匹配的方式进行匹配;这就意味着对于该问题的求解实际上可以划分为若干小问题的求解,那...
请教一个正则表达式匹配问题
http://topic.csdn.net/u/20100723/11/44cf0267-cae0-4752-9e80-d5f955741274.htmlrnrn这里的朋友,回复了,但是为什么放在php里没有效果呢,有工具可以匹配。rnrn我的php代码:rnrn$text=str_replace("]+/>)[^>]*>","",$text);rn$text=str_replace("]+/>)[^>]*>","",$text);rnrnphp的正则与.net的是一样的吗?
稳定匹配(解决婚姻问题)
婚姻问题nn现在有N位男生和N位女生,每个男生都对N个女生的喜欢程度做了排序,每个女生都对N个男生的喜欢程度做了排序,现在需要确定一个稳定的约会状态。nn稳定的定义:如果男生i和女生a牵手,但男生i对女生b更喜欢,而女生b发现,相比自己的男朋友j,她更喜欢男生i,则没有力量阻碍男生i和女生b的私奔,这即是不稳定的。nnnnnn解决思路nnn首先选择一个单身男生,他会按照他的喜欢程度对一个还没有表白...
请教一个正则表达式匹配问题。
不匹配它rn 匹配它rnrn想处理一下网页中,找出img标签,没有反斜杠的img标签,进行替换
一个正则表达式匹配问题
已知一个字符串,形如"\n name"或者"name"rn即字符串中可能有一个回车,然后接若干个空格(空格数未知),有回车必定会有至少一个空格.若没有回车则必定没有空格.rn现在要提取出"name",如何实现呢?谢谢rn
一个正则表达式的匹配问题
最近在做微信公众平台需要抓取页面数据,在网上找到了一个例子,它是在字符串[code=csharp]"contacts":["id":XXXXX,"nick_name":"灏忔伜","remark_name":"","group_id":0][/code]rn中写了这样一个正则,[code=csharp]\"id\":\\d+,\"nick_name\"[/code]rn匹配到了 [code=csharp]"id":XXXX,"nick_name"[/code]rn但是本人正则比较水,想要改写为匹配成 "id":XXXXX,"nick_name":"灏忔伜",请问该怎么做?
二分图的最大匹配问题
1.定义nn二分图: n  将一个图的所有顶点划分为两个不相交集U和V,使得图中的每一条边的顶点分别属于点集合U和点集V,即同一点集中的点不构成边,这样的图叫做二分图。维基百科中给出的无向图G的二分图的充分必要条件是:G至少有两个顶点,且其所有回路的长度均为偶数。下图为带有回路的二分图举例: nnn匹配: n  图中匹配的定义是指,这个图的一个边的集合,集合中任意两条边都没有公共的顶点,则称这个边...
《经典算法》稳定婚姻匹配
题目:nn婚介所登记了N位男孩和N位女孩,每个男孩都对N个女孩的喜欢程度做了排序,每个女孩都对N个男孩的喜欢程度做了排序,你作为月老,能否给出稳定的牵手方案?nn稳定的定义:如果男孩i和女孩a牵手,但男孩i对女孩b更喜欢,而女孩b的男朋友j拼不过男孩i,则没有力量阻碍男孩i和女孩b的私奔,这即是不稳定的。nn思路:nn   1962 年,美国数学家 David Gale 和 Lloyd Shapl...
10.正则表达式匹配【剑指offer——JAVA实现】【LeetCode——JAVA实现】
题目描述LeetCode 10给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配。'.' 匹配任意单个字符。n'*' 匹配零个或多个前面的元素。n匹配应该覆盖整个字符串 (s) ,而不是部分字符串。说明:s 可能为空,且只包含从 a-z 的小写字母。p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。示例 1:输入:ns = &quot;aa&quot;np...
【python】求助 关于正则表达式匹配问题
[code=python]import re rnptn = re.compile('.*? ')rns = """rnrnrn rnrn"""rnfind = ptn.search(s,re.DOTALL)rn#ss = find.group(1)rnpass[/code]rnrn我是想要匹配出testing string!但是最后find是None,求解!
LeetCode第10题(正则表达式匹配)+一点dp思想概述
今天刚好把第100题给刷完,第10题,在最开始刚刷题的时候,说实话是真的难,当时对dp只是粗略的了解,所以写了很多方法,都是时间复杂度达不到,但又不想百度别人的答案,所以就一直放到现在了。。。原题如下:rn给定一个字符串 (s) 和一个字符模式 §。实现支持 ‘.’ 和 ‘*’ 的正则表达式匹配。rn‘.’ 匹配任意单个字符。rn‘*’ 匹配零个或多个前面的元素。rn匹配应该覆盖整个字符串 (s) ,而不...
1203:扩号匹配问题
时间限制: 1000 ms 内存限制: 65536 KB n提交数: 1424 通过数: 744 nnnn【题目描述】nn在某个字符串(长度不超过100)中有左括号、右括号和大小写字母;规定(与常见的算数式子一样)任何一个左括号都从内到外与在它右边且距离最近的右括号匹配。写一个程序,找到无法匹配的左括号和右括号,输出原来字符串,并在下一行标出不能匹配的括号。不能匹配的左括号...
二分图的最大匹配问题完整代码
二分图的最大匹配问题很多博客原理讲的已经很清楚了,贴出来几个链接:rn二分图的最大匹配问题解决原理rn二分图最大匹配原理rnrnrn自己花了两天时间敲出来的代码,感觉成长了很多:rn#include nusing namespace std;nnint n, m;//n代表图的点数, m代表边数nint len;//用来记录一条增广路径nconst int maxn_node = 1e2+5;nb
括号匹配问题(不用栈,用数组)
不用模板栈的话,就是建立一个数组,输入若是左括号,则入栈,stack[++top]=a[i],top为栈顶元素的指针,若是右括号,则出栈,stack[top--]。rn此处关键是自增符号的顺序,为什么入栈要先加,出栈后减,因为栈顶指针永远都是最后一个元素前一个位置,入栈的时候要先移动指针,到上一个,才可以进栈。rn还有要判断什么时候栈空,遇到右括号,如果此时栈空,即top==0,则左边没有元素了,
【Python】通过栈实现括号匹配
括号匹配 示例:nnn 字符串中有括号”()[]{}”。设计算法,判断该字符串是否有效 n 括号必须以正确的顺序配对,如:“()”、“()[]”是有效的,但“([)]”无效nnnPython代码如下:nnnndef match_parentheses(s):n # 把一个list当做栈使用n ls = []n parentheses = &amp;quot;()[]{}&amp;quot;n for i ...
详解正则表达式匹配算法原理
正则表达式的匹配算法,是怎么实现的呢?
《剑指offer》【正则表达式匹配】(python版)
题目描述:请实现一个函数用来匹配包括’.’和’*’的正则表达式。模式中的字符’.’表示任意一个字符,而’*’表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串”aaa”与模式”a.a”和”ab*ac*a”匹配,但是与”aa.a”和”ab*a”均不匹配nn思路:本题就是很直观的字符串的匹配,难点在于当遇到模式中两个特殊字符怎么处理和对于各种形式...
剑指offer:正则表达式匹配(Python)
题目描述nn请实现一个函数用来匹配包括.和*的正则表达式。模式中的字符.表示任意一个字符,而*表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串aaa与模式a.a和ab*ac*a匹配,但是与aa.a和ab*a均不匹配。nn解题思路nn思路来自牛客网 n当模式中的第二个字符不是*时: n1. 如果字符串第一个字符和模式中的第一个字符相匹配,那么...
PYTHON正则表达式
PYTHON,正则表达式 PYTHON,正则表达式 PYTHON,正则表达式 PYTHON,正则表达式
动态规划 | 带有通配符的字符串匹配(浅显易懂)
带有通配符的字符串匹配一、Leetcode | 44 Wildcard Matching(只有一个字符串包含通配符)题目很简单,就是说两个字符串,一个含有通配符,去匹配另一个字符串;输出两个字符串是否一致。注意:’?’表示匹配任意一个字符,’*’表示匹配任意字符0或者多次首先,我们想到暴力破解。如果从头到尾的破解,到第二个字符时,是否匹配成功取决于第一个字符是否匹配成功! 所以我们想到应该要用到动态
Python中正则表达式对单个字符,多个字符,匹配边界等使用
Regular Expression,正则表达式,又称正规表示式、正规表示法、正则表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的...
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 正则表达式教程python python正则表达式教程