「已注销」 2022-06-20 00:13 采纳率: 0%
浏览 45
已结题

爬虫小bai,遇见问题

爬虫小bai,遇见问题
浏览器为edge
pycharm用的最新版本
写出代码,但是运行不了,又没找出错误😢
望big old指点迷津🤤

import requests
import json
if name=="main":
get_url = " https://movie.douban.com/j/new_search_subjects?%22
start = input('请输入你想看的名次:')
params = {
' sort': 'U',
'range': '0, 1', #
'tags': ' ',
'start': 'start', #用start来动态的控制你想看的名次
'genres': '科幻',
}
#进行UA伪装
headers = {
'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.124 Safari/537.36 Edg/102.0.1245.44'
}
response = requests.get(url=get_url,params=params,headers=headers)
dic_json = response.json()
wjm = start+'.json'
fp = open(wjm, 'w', encoding='utf-8')
json.dump(dic_json,fp=fp,ensure_ascii=False)
print('爬取成功')

  • 写回答

2条回答 默认 最新

  • 天际的海浪 2022-06-20 00:36
    关注
    获得2.50元问题酬金
    ' sort': 'U',  sort前面多了个空格
    'tags': '', 引号中不要有空格
    'start': start, 冒号后的start不要放引号中
    

    'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.124 Safari/537.36 Edg/102.0.1245.44'
    前面少了'User-Agent':
    应该是

    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.124 Safari/537.36 Edg/102.0.1245.44'

    你题目的解答代码如下:

    import requests
    import json
    if __name__ == "__main__":
        get_url = "https://movie.douban.com/j/new_search_subjects?"
        start = input('请输入你想看的名次:')
        params = {
        'sort': 'U',
        'range': '0,10',
        'tags': '',
        'start': start,
        'genres': '科幻',
        }
        #进行UA伪装
        headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.124 Safari/537.36 Edg/102.0.1245.44'
        }
        response = requests.get(url=get_url,params=params,headers=headers)
        dic_json = response.json()
        wjm = start+'.json'
        fp = open(wjm, 'w', encoding='utf-8')
        json.dump(dic_json,fp=fp,ensure_ascii=False)
        print(dic_json)
        print('爬取成功')
    

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 6月28日
  • 创建了问题 6月20日

悬赏问题

  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记