qq_43721455 2021-06-06 22:25 采纳率: 50%
浏览 22
已采纳

python爬虫问题

obj = re.compile(r'<li>.*?<span class="title">(?P<name>.*?)'
                 r'</span>.*?<p class="">.*?<br>(?P<year>.*?)&nbsp.*?</span '
                 r'class="rating_num" property="v:average">(?P<star>.*?)</span>', re.S)

obj = re.compile(r'<li>.*?<span class="title">(?P<name>.*?)</span>' , re.S)
obj = re.compile(r'</span>.*?<p class="">.*?<br>(?P<year>.*?)&nbsp.*?</span' , re.S)
obj = re.compile(r'class="rating_num" property="v:average">(?P<star>.*?)</span>.*?', re.S)

爬取网页内容时,用第一种方法爬不到东西,但是我将它们分开写之后是能爬到东西的,请问是什么问题

  • 写回答

2条回答 默认 最新

  • 小P聊技术 2021-06-06 22:27
    关注

    因为你的正则匹配写的太长,可能匹配不到你想要的html,但是你分开之后,匹配的内容相对少,出现错误的几率就低,建议分段匹配

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序