data=pd.DataFrame(data_train)
data_matrix=data.as_matrix()
dataframe输出的:
Diabetes 8.091600 0.041000
matrix输出的
['Diabetes' 8.0916 0.040999999999999995]
为什么0.041000会变成0.040999999999999995?
data=pd.DataFrame(data_train)
data_matrix=data.as_matrix()
dataframe输出的:
Diabetes 8.091600 0.041000
matrix输出的
['Diabetes' 8.0916 0.040999999999999995]
为什么0.041000会变成0.040999999999999995?
浮点数存在两种误差,一个是本身精度的误差。比如0.1,在10进制里是一个有限小数,用二进制表示,就是无限循环小数,但是浮点数只能存n位有限的尾数,那么浮点数的表示就有误差。
误差又因为四则运算被扩大。一个极端的情况,对两个范围差别很大的不精确的浮点数做加减,那么比较小的那个数误差会变大。
另一个是和10进制的转换误差,将2进制转换为10进制,尾数不能精确表示的,也会有误差。
最后,浮点数在不同环境下,运算可能结果不同。比如说,采用传统的x87浮点处理器,内部保存80位,而sse指令只保存64位。这导致不同的设备计算的结果还可能不同。
所以出现你这样的情况一点也不奇怪。