我在用正则表达式爬取豆瓣电影里面的电影演员信息。
网页演员信息的位置如下:
那么要爬取其中的这些演员名不就是下面的代码吗?
actors = re.findall(r'<div class="meta abstract_2">(.*?)</div>', resp, re.DOTALL)
其中resp是前面获取到的网页代码
可是print(actors)输出结果为空,请问是哪里不对呀?
有没有大佬就用正则表达式帮忙解答一下?因为我用爬虫只会用正则表达式匹配。
我在用正则表达式爬取豆瓣电影里面的电影演员信息。
网页演员信息的位置如下:
那么要爬取其中的这些演员名不就是下面的代码吗?
actors = re.findall(r'<div class="meta abstract_2">(.*?)</div>', resp, re.DOTALL)
其中resp是前面获取到的网页代码
可是print(actors)输出结果为空,请问是哪里不对呀?
有没有大佬就用正则表达式帮忙解答一下?因为我用爬虫只会用正则表达式匹配。