用Python 正则爬豆瓣评分排名前250电影,遇到一个问题:第209部电影爬取导演信息失败。
https://movie.douban.com/top250?start=200&filter=
我看了一下网页源代码,发现一个问题,第209部电影的导演字段和其它电影的都不一样,其它电影都是以 结尾,但是这个电影是以..
结尾。见截图:以下是正常情况,
下面是异常情况:
这是我的正则:
目前250部电影就只发现了这一个case爬不下来,请问各位,有没有好的正则方法可以同时捞出 第209和其他电影。感谢~