stellashen9 2022-05-08 17:46 采纳率: 57.1%
浏览 140
已结题

housing.csv 从github 获取失败

问题遇到的现象和发生背景

从网址:https://github.com/ageron/handson-ml2
从GitHub获取机器 学习 实战: 基于 Scikit- Learn、 Keras 和 TensorFlow: 原 书 第 2 版里面的数据
复制书上coding 到Jupyter

问题相关代码,请勿粘贴截图

全部抄了书上的代码2.3.2 下载数据

运行结果及报错内容

ileNotFoundError: [Errno 2] No such file or directory: 'datasets\housing\housing.csv'

我的解答思路和尝试过的方法

代码检查无误

我想要达到的结果

自动下载成功

  • 写回答

5条回答 默认 最新

  • CSDN专家-HGJ 2022-05-08 21:27
    关注

    题主需要在第二个函数里调用第一个函数,对数据下载并解压后再读取和处理,代码改为如下即可:

    import os
    import tarfile
    
    from six.moves import urllib
    DOWNLOAD_ROOT = "https://raw.githubusercontent.com/ageron/handson-ml2/master/"
    HOUSING_PATH = os.path.join("datasets", "housing")
    HOUSING_URL = DOWNLOAD_ROOT + "datasets/housing/housing.tgz"
    def fetch_housing_data(housing_url=HOUSING_URL, housing_path=HOUSING_PATH):
    
        if not os.path.isdir(housing_path):
            os.makedirs(housing_path)
        tgz_path = os.path.join(housing_path, "housing.tgz")
        urllib.request.urlretrieve(housing_url, tgz_path)
        housing_tgz = tarfile.open(tgz_path)
        housing_tgz.extractall(path=housing_path)
        housing_tgz.close()
    
    import pandas as pd
    def load_housing_data(housing_path=HOUSING_PATH):
        fetch_housing_data()
        csv_path = os.path.join(housing_path, "housing.csv")
        return pd.read_csv(csv_path)
    
    housing = load_housing_data()
    print(housing.head())
    
    
    longitude  latitude  housing_median_age  total_rooms  total_bedrooms  population  households  median_income  median_house_value ocean_proximity
    0    -122.23     37.88                41.0        880.0           129.0       322.0       126.0         8.3252            452600.0        NEAR BAY
    1    -122.22     37.86                21.0       7099.0          1106.0      2401.0      1138.0         8.3014            358500.0        NEAR BAY
    ...
    
    

    如有帮助,请采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 5月17日
  • 已采纳回答 5月9日
  • 创建了问题 5月8日

悬赏问题

  • ¥30 酬劳2w元求合作写文章
  • ¥15 在现有系统基础上增加功能
  • ¥15 远程桌面文档内容复制粘贴,格式会变化
  • ¥15 关于#java#的问题:找一份能快速看完mooc视频的代码
  • ¥15 这种微信登录授权 谁可以做啊
  • ¥15 请问我该如何添加自己的数据去运行蚁群算法代码
  • ¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
  • ¥15 网络设备配置与管理这个该怎么弄
  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图