4v1d 2021-09-12 16:51 采纳率: 75%
浏览 457

pycharm里出现如下报错 [Errno 11002] getaddrinfo failed

img

然后我的代码是这样的

import urllib.request, urllib.error
import re
from bs4 import BeautifulSoup
import xlwt


def main():
    baseurl = "https://movie.douban.com/top250?start="
    # 1.爬取网页
    datalist = getData(baseurl)
    savepath = ".\\豆瓣电影Top250.xls"#一个 . 表示保存在当前文件夹,加\\表示当前的位置
    #3.保存数据
    #saveData(savepath)

    #askURL("https://movie.douaban.com/top250?start=0")
#爬取网页
def getData(baseurl):
    datalist = []#列表
    for i in range(0,10):
        url = baseurl + str(i*25)
        html = askURL(url)        #保存获取到的网页源码
    #逐一解析数据
    return datalist

#得到指定一个指定url的网页内容
def askURL(url):
    head = {  # 模拟浏览器头部信息,向豆瓣服务器发送消息
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36"
    }
    # 用户代理,表示告诉豆瓣服务器,我们是什么类型的机器、浏览器(本质上是告诉浏览器,我们可以接收什么水平的文件内容)
    request = urllib.request.Request(url, headers=head)
    html = ""
    try:
        response = urllib.request.urlopen(request)
        html = response.read().decode("utf-8")
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

    #return html






#保存数据
def saveData(savepath):
    print("save.....")







if __name__ == "__main__":
    main()# 当程序执行时

    # 函数调用
  • 写回答

2条回答 默认 最新

  • Feng-licong 2021-09-12 16:56
    关注

    askURL的return被你注释掉了

    评论

报告相同问题?

问题事件

  • 创建了问题 9月12日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题