usnskks 2023-02-21 18:53 采纳率: 57.1%
浏览 37
已结题

关于#数据清洗#的问题,如何解决?


import numpy as np
import pandas as pd
#1利用read_csv导入9healthy_lifestyle_city_2021.csv
d=pd.read_csv(r'C:\Users\ASUS\Desktop\毕设代码\fangjia2019.csv',sep=',')
pd.set_option('display.max_columns', None)#显示所有列
d.info()#快速浏览数据,查看所有列数据类型以及每列中非空值的数量
print(d)#打印数据
#2用均值填充缺失值NaN
d.fillna(d.mean(),inplace=True)#要不要在源数据填充
print(d.isnull().any())#统计data里每一列是否有空值,出现空值就删除
#3保存至新数据表 数据清洗后数据.csv
d.to_csv("fangjia2019_清洗.csv",sep=',',encoding='utf_8_sig')

img


怎么可以把横杠去除,我只会删除空值

  • 写回答

2条回答 默认 最新

  • cjh4312 2023-02-21 19:21
    关注

    d=d.replace('-',0)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月6日
  • 已采纳回答 2月26日
  • 创建了问题 2月21日

悬赏问题

  • ¥15 excel 日常使用中出现问题
  • ¥20 pdusession建立失败
  • ¥15 为什么mqtt接收不到数据?
  • ¥15 思科校园网的组建,sos!
  • ¥15 主要进行描述非满管状态下,管路的摩阻系数是怎么变化的,在管路长度方向上是怎么分布的(标签-matlab)
  • ¥15 multisim设计求解如图
  • ¥15 动态多目标优化,求解定义的问题的POF和POS公式
  • ¥30 实验 :UML2.0 行为建模
  • ¥15 设计一种优化调度算法并结合论文中的案例给出调度计划
  • ¥15 py文件打包exe报错TypeError:expected str,bytes or os.PathLike object,not_io.BytesIO