Studying!!! 2020-05-04 10:23 采纳率: 100%
浏览 474
已采纳

做了python爬取豆瓣电影程序,但是一直出错

import requests
import json
if __name__ == "__main__":
    url = 'https://movie.douban.com/j/search_subjects'    # 指定URL
    params = {
        'type':'movie', 'tag':'%E5%96%9C%E5%89%A7','sort':'recommend', 'page_limit':'20',
        'page_start':'0'
    }
    headers = {
        'User Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36'
    }  # UA伪装
    response = requests.get(url=url, params=params, headers=headers)    # get请求
    # 获取响应数据
    list_data = response.json()
    fp = open('./douban.json', 'w', encoding='utf-8')
    json.dump(list_data, fp=fp, ensure_ascii=False)
    print('保存成功!!!')


  • 写回答

2条回答 默认 最新

  • 毕小宝 博客专家认证 2020-05-04 11:07
    关注

    我也爬过豆瓣,应该是你直接用 response.json 这个用法不对,应该将 response.text 转成 JSON:

    import requests
    import json
    
    url="https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0"
    headers = {
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36",
    "Referer":"https://movie.douban.com/"
    }
    response = requests.get(url,headers=headers)
    
    # loads as json
    result = json.loads(response.text)
    
    # get subjects 
    subjects = result['subjects']
    
    
    def itemInfo(item):
        info = '{},{},{},{}\r\n'.format(item['title'], item['rate'],item['url'],item['cover_x'])
        return info
    
    # write to file
    f1 = open('E:/film.log','w',encoding='utf-8')
    for item in subjects:
        print(itemInfo(item))
        f1.write(itemInfo(item))
    

    结果:
    图片说明

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥20 求数据集和代码#有偿答复
  • ¥15 关于下拉菜单选项关联的问题
  • ¥20 java-OJ-健康体检
  • ¥15 rs485的上拉下拉,不会对a-b<-200mv有影响吗,就是接受时,对判断逻辑0有影响吗
  • ¥15 使用phpstudy在云服务器上搭建个人网站
  • ¥15 应该如何判断含间隙的曲柄摇杆机构,轴与轴承是否发生了碰撞?
  • ¥15 vue3+express部署到nginx
  • ¥20 搭建pt1000三线制高精度测温电路
  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况
  • ¥15 画两个图 python或R