import csv
import numpy as np
import pandas as pd
#1利用read_csv导入9healthy_lifestyle_city_2021.csv
d=pd.read_csv(r'C:\Users\ASUS\Desktop\毕设代码\fangjia2019.csv',sep=',')
pd.set_option('display.max_columns', None)#显示所有列
d=d.replace('—',0)#把横杠变成0
d.info()#快速浏览数据,查看所有列数据类型以及每列中非空值的数量
any(d.duplicated())
np.sum(d.duplicated())
d.drop_duplicates(inplace=True)
print(d)#打印数据
#2用均值填充缺失值NaN
#d.fillna(d.mean(),inplace=True)#要不要在源数据填充
print(d.isnull().any())#统计data里每一列是否有空值,出现空值就删除
#3保存至新数据表 数据清洗后数据.csv
d.to_csv("fangjia2019_清洗.csv",sep=',',encoding='utf_8_sig')
怎么删除房价中的元/㎡