我打算判断我手头的数据是否服从正态分布或者是卡方分布,我使用的代码如下:
stats.kstest(g, 'norm', (g.mean(), g.std()))
运行结果如下:
KstestResult(statistic=0.13836314532285626, pvalue=8.652868214726363e-06)
这是 pvalue < 0.05 了,这是说明服从正态分布还是不服从呢?
我在网上搜了很多,大多都说是 pvalue 要大于 0.05 才算是原假设成立;但也有说小于0.05的,这个我就搞蒙了。
而这段数据(g)可视化如图:
我觉得应该算是卡方或者正态分布吧。总的来说,就是 pvalue 要如何看?
我是不是可以通过比对 cdf 为 'norm' 和 'chi2' 时的 pvalue 来判断这组数据更符合什么分布?具体是怎么判断的呢?值越大越好还是?