m0_56957127 2022-02-01 16:17 采纳率: 100%
浏览 155
已结题

爬虫代码应该是对的,但是运行不出来 只有一行路径

想要爬取出我要的数据


import requests
import re
url="https://movie.douban.com/top250"
head={
    #UA,服务器对当前的网络设置进行检测
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"
}
resp=requests.get(url,headers=head)#处理反爬
resp.encoding='utf-8'


obj = re.compile(r'<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
               r'.*?<br>(?P<year>.*?)&nbsp;.*? <span class="rating_num"'
               r'property="v:average">(?P<pingfeng>.*?)</span>.*?'
               r'<span>(?P<num>.*?)人评价</span>',re.S)

result = obj.finditer(resp.text)
for item in result:
    dic=item.groupdict()
    dic['year'] = dic['year'].strip()
    print(dic)
  • 写回答

2条回答 默认 最新

  • CSDN专家-showbo 2022-02-01 17:03
    关注

    评分正则有问题,少了空格

    img

    改下面就可以了

    img

     
    import requests
    import re
    url="https://movie.douban.com/top250"
    head={
        #UA,服务器对当前的网络设置进行检测
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"
    }
    resp=requests.get(url,headers=head)#处理反爬
    resp.encoding='utf-8'
     
     
    obj = re.compile(r'<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
                   r'.*?<br>(?P<year>.*?)&nbsp;.*?<span class="rating_num"'
                   r' property="v:average">(?P<pingfeng>.*?)</span>.*?'
                   r'<span>(?P<num>.*?)人评价</span>',re.S)
     
    result = obj.finditer(resp.text)
    for item in result:
        dic=item.groupdict()
        dic['year'] = dic['year'].strip()
        print(dic)
    
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 2月9日
  • 已采纳回答 2月1日
  • 创建了问题 2月1日

悬赏问题

  • ¥15 如何用Labview在myRIO上做LCD显示?(语言-开发语言)
  • ¥15 Vue3地图和异步函数使用
  • ¥15 C++ yoloV5改写遇到的问题
  • ¥20 win11修改中文用户名路径
  • ¥15 win2012磁盘空间不足,c盘正常,d盘无法写入
  • ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
  • ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
  • ¥15 帮我写一个c++工程
  • ¥30 Eclipse官网打不开,官网首页进不去,显示无法访问此页面,求解决方法
  • ¥15 关于smbclient 库的使用