请看源码:
import dask.dataframe as dd
# 读取大数据集
df = dd.read_csv('../6/数据源/farming2.csv',assume_missing=True)
#数据类型转换
df['平均交易价格'] = dd.to_numeric(df['平均交易价格'], errors='coerce')
print(df['平均交易价格'].dtypes)
print(df.dtypes)
# 进行数据处理
mean_df = df['平均交易价格'].mean(numeric_only=True).compute()
请看报错
神奇的是,这列数据它就是数值型
所以这个报错很奇怪,其实目标就是为了找出“平均交易价格”这列数据的异常值由于数据量太大之前pandas一直跑不出结果就换了dask去处理,结果现在报错了,问了AI也解决不了。
以下附上数据集,感谢指点thx
[](通过网盘分享的文件:data
链接: https://pan.baidu.com/s/18YkogYGuOEHCsBC8NfioBQ?pwd=xtyd 提取码: xtyd)