请教一个 Python 爬虫信息提取问题

最近在学写爬虫,聚合程序员的招聘信息,已经聚合了几个网站数据: http://www.codejob.me

但在写智联招聘爬虫的时候,薪酬如'6001-8000'

我的python代码:

s = '6001-8000'
if '-' in s:
    m = re.match(r'(.*?)-(.*?)', s)
    print m.group(1)
    print m.group(2)

为什么m.group(1)成功得到6001,而m.group(2)得到的是空? 想请教一下大家了。

5个回答

try:

 m = re.match(r'(\d*?)\s*-\s*(\d*?)', s)
m = re.match(r'(.*)-(.*)', s)

你第二个?,非贪婪方式,那么就可以匹配空字符串

减号应该加转义符的吧。

 m = re.match(r'(.*?)\-(.*?)', s)

(.*)-(.*),是你正则写的不对。
图片说明

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐