usnskks 2023-02-27 10:38 采纳率: 57.1%
浏览 61
已结题

数据清洗修改数值#数据清洗


import csv
import numpy as np
import pandas as pd
#1利用read_csv导入9healthy_lifestyle_city_2021.csv
d=pd.read_csv(r'C:\Users\ASUS\Desktop\毕设代码\fangjia2019.csv',sep=',')
pd.set_option('display.max_columns', None)#显示所有列
d=d.replace('—',0)#把横杠变成0
d.info()#快速浏览数据,查看所有列数据类型以及每列中非空值的数量
any(d.duplicated())
np.sum(d.duplicated())
d.drop_duplicates(inplace=True)
print(d)#打印数据
#2用均值填充缺失值NaN
#d.fillna(d.mean(),inplace=True)#要不要在源数据填充
print(d.isnull().any())#统计data里每一列是否有空值,出现空值就删除
#3保存至新数据表 数据清洗后数据.csv
d.to_csv("fangjia2019_清洗.csv",sep=',',encoding='utf_8_sig')

img

怎么删除房价中的元/㎡

  • 写回答

4条回答 默认 最新

  • Dick_不周 2023-02-27 11:14
    关注

    Dataframe修改是不是更好一点哈哈哈。
    有用请采纳

    d['房价'] = d['房价'].apply(lambda x : re.search('(\d+)元/㎡',x).group(1))
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 3月7日
  • 已采纳回答 2月27日
  • 创建了问题 2月27日

悬赏问题

  • ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
  • ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
  • ¥15 帮我写一个c++工程
  • ¥30 Eclipse官网打不开,官网首页进不去,显示无法访问此页面,求解决方法
  • ¥15 关于smbclient 库的使用
  • ¥15 微信小程序协议怎么写
  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?