给定了csv文件,要求为数据新增一列,命名为‘新属性’:
计算‘属性4’的均值(该列已给出),若‘属性4’的值大于该均值,则将‘新属性’取值为“1”;否则为“0”
我写的:
df['新属性'] = '0'
df
df_mean = df['属性4'].mean()
print (df_mean)
data.loc[data['属性4'] > df_mean] = 1
data.loc[data['属性4'] <= df_mean] = 0
但并没有显示取值为“1”和“0”的新列
给定了csv文件,要求为数据新增一列,命名为‘新属性’:
计算‘属性4’的均值(该列已给出),若‘属性4’的值大于该均值,则将‘新属性’取值为“1”;否则为“0”
我写的:
df['新属性'] = '0'
df
df_mean = df['属性4'].mean()
print (df_mean)
data.loc[data['属性4'] > df_mean] = 1
data.loc[data['属性4'] <= df_mean] = 0
但并没有显示取值为“1”和“0”的新列
import pandas as pd
import numpy as np
df=pd.read_excel(r'C:\Users\jackey\Desktop\CSDN/test.xlsx')
df_mean=df['A'].mean()
df['新属性'] = np.where(
df['A'] > df_mean,
1,
0
)
print(df)
输出:
A 新属性
0 1 0
1 2 0
2 3 0
3 4 1
4 5 1
5 6 1
参考以上代码,如果帮到你,帮忙采纳下,多谢!