m0_56957127 2022-02-01 16:17 采纳率: 100%
浏览 155
已结题

爬虫代码应该是对的,但是运行不出来 只有一行路径

想要爬取出我要的数据


import requests
import re
url="https://movie.douban.com/top250"
head={
    #UA,服务器对当前的网络设置进行检测
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"
}
resp=requests.get(url,headers=head)#处理反爬
resp.encoding='utf-8'


obj = re.compile(r'<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
               r'.*?<br>(?P<year>.*?)&nbsp;.*? <span class="rating_num"'
               r'property="v:average">(?P<pingfeng>.*?)</span>.*?'
               r'<span>(?P<num>.*?)人评价</span>',re.S)

result = obj.finditer(resp.text)
for item in result:
    dic=item.groupdict()
    dic['year'] = dic['year'].strip()
    print(dic)
  • 写回答

2条回答 默认 最新

  • CSDN专家-showbo 2022-02-01 17:03
    关注

    评分正则有问题,少了空格

    img

    改下面就可以了

    img

     
    import requests
    import re
    url="https://movie.douban.com/top250"
    head={
        #UA,服务器对当前的网络设置进行检测
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"
    }
    resp=requests.get(url,headers=head)#处理反爬
    resp.encoding='utf-8'
     
     
    obj = re.compile(r'<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
                   r'.*?<br>(?P<year>.*?)&nbsp;.*?<span class="rating_num"'
                   r' property="v:average">(?P<pingfeng>.*?)</span>.*?'
                   r'<span>(?P<num>.*?)人评价</span>',re.S)
     
    result = obj.finditer(resp.text)
    for item in result:
        dic=item.groupdict()
        dic['year'] = dic['year'].strip()
        print(dic)
    
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 2月9日
  • 已采纳回答 2月1日
  • 创建了问题 2月1日

悬赏问题

  • ¥15 Macbookpro 连接热点正常上网,连接不了Wi-Fi。
  • ¥15 delphi webbrowser组件网页下拉菜单自动选择问题
  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析