小弟使用pandas的统计函数mean求均值,但是结果是空值,请求论坛大神们帮小弟解惑啊!

小弟使用pandas的统计函数mean,求一下df各列的平均,但是结果是空值,请求论坛大神们帮小弟解惑啊,下面是打印的df和mean函数输出的均值结果。
df长这样:
VERSION MODEL FCST_LEAD FCST_VALID_BEG FCST_VALID_END OBS_LEAD \
5 V5.2 WRF 480000 20180507_000000 20180507_000000 0

5 V5.2 WRF 480000 20180508_000000 20180508_000000 0

5 V5.2 WRF 480000 20180509_000000 20180509_000000 0

5 V5.2 WRF 480000 20180510_000000 20180510_000000 0

5 V5.2 WRF 480000 20180511_000000 20180511_000000 0

5 V5.2 WRF 480000 20180512_000000 20180512_000000 0

5 V5.2 WRF 480000 20180513_000000 20180513_000000 0

5 V5.2 WRF 480000 20180514_000000 20180514_000000 0

5 V5.2 WRF 480000 20180515_000000 20180515_000000 0

5 V5.2 WRF 480000 20180516_000000 20180516_000000 0

5 V5.2 WRF 480000 20180517_000000 20180517_000000 0

5 V5.2 WRF 480000 20180518_000000 20180518_000000 0

5 V5.2 WRF 480000 20180519_000000 20180519_000000 0

5 V5.2 WRF 480000 20180520_000000 20180520_000000 0

5 V5.2 WRF 480000 20180521_000000 20180521_000000 0

5 V5.2 WRF 480000 20180522_000000 20180522_000000 0

 OBS_VALID_BEG    OBS_VALID_END FCST_VAR FCST_LEV  ...  FCST_THRESH  \

5 20180506_223000 20180507_013000 APCP_06 A6 ... >=50.0

5 20180507_223000 20180508_013000 APCP_06 A6 ... >=50.0

5 20180508_223000 20180509_013000 APCP_06 A6 ... >=50.0

5 20180509_223000 20180510_013000 APCP_06 A6 ... >=50.0

5 20180510_223000 20180511_013000 APCP_06 A6 ... >=50.0

5 20180511_223000 20180512_013000 APCP_06 A6 ... >=50.0

5 20180512_223000 20180513_013000 APCP_06 A6 ... >=50.0

5 20180513_223000 20180514_013000 APCP_06 A6 ... >=50.0

5 20180514_223000 20180515_013000 APCP_06 A6 ... >=50.0

5 20180515_223000 20180516_013000 APCP_06 A6 ... >=50.0

5 20180516_223000 20180517_013000 APCP_06 A6 ... >=50.0

5 20180517_223000 20180518_013000 APCP_06 A6 ... >=50.0

5 20180518_223000 20180519_013000 APCP_06 A6 ... >=50.0

5 20180519_223000 20180520_013000 APCP_06 A6 ... >=50.0

5 20180520_223000 20180521_013000 APCP_06 A6 ... >=50.0

5 20180521_223000 20180522_013000 APCP_06 A6 ... >=50.0

OBS_THRESH COV_THRESH ALPHA LINE_TYPE TOTAL FY_OY FY_ON FN_OY FN_ON

5 >=50.0 NaN NaN CTC 2677 0 0 0 2677

5 >=50.0 NaN NaN CTC 2678 0 0 0 2678

5 >=50.0 NaN NaN CTC 2678 0 0 0 2678

5 >=50.0 NaN NaN CTC 2672 0 0 1 2671

5 >=50.0 NaN NaN CTC 2668 0 1 0 2667

5 >=50.0 NaN NaN CTC 2670 0 0 0 2670

5 >=50.0 NaN NaN CTC 2672 0 0 0 2672

5 >=50.0 NaN NaN CTC 2670 0 0 0 2670

5 >=50.0 NaN NaN CTC 2671 0 0 0 2671

5 >=50.0 NaN NaN CTC 2670 0 0 0 2670

5 >=50.0 NaN NaN CTC 2674 0 0 0 2674

5 >=50.0 NaN NaN CTC 2673 0 0 0 2673

5 >=50.0 NaN NaN CTC 2671 0 2 0 2669

5 >=50.0 NaN NaN CTC 2672 0 1 0 2671

5 >=50.0 NaN NaN CTC 2671 0 0 1 2670

5 >=50.0 NaN NaN CTC 2671 0 0 0 2671

[16 rows x 26 columns]

df.mean(axis=0,skipna=False)函数输出结果是这样
Series([], dtype: float64)

最奇怪的是另一个df就没问题
下面是另一个df长这样:
VERSION MODEL FCST_LEAD FCST_VALID_BEG FCST_VALID_END OBS_LEAD \
5 V5.2 WRF 480000 20180507_000000 20180507_000000 0

5 V5.2 WRF 480000 20180508_000000 20180508_000000 0

5 V5.2 WRF 480000 20180509_000000 20180509_000000 0

5 V5.2 WRF 480000 20180510_000000 20180510_000000 0

5 V5.2 WRF 480000 20180511_000000 20180511_000000 0

5 V5.2 WRF 480000 20180512_000000 20180512_000000 0

5 V5.2 WRF 480000 20180513_000000 20180513_000000 0

5 V5.2 WRF 480000 20180514_000000 20180514_000000 0

5 V5.2 WRF 480000 20180515_000000 20180515_000000 0

5 V5.2 WRF 480000 20180516_000000 20180516_000000 0

5 V5.2 WRF 480000 20180517_000000 20180517_000000 0

5 V5.2 WRF 480000 20180518_000000 20180518_000000 0

5 V5.2 WRF 480000 20180519_000000 20180519_000000 0

5 V5.2 WRF 480000 20180520_000000 20180520_000000 0

5 V5.2 WRF 480000 20180521_000000 20180521_000000 0

5 V5.2 WRF 480000 20180522_000000 20180522_000000 0

 OBS_VALID_BEG    OBS_VALID_END FCST_VAR FCST_LEV    ...     EDI_BCL  \

5 20180506_223000 20180507_013000 APCP_06 A6 ... NaN

5 20180507_223000 20180508_013000 APCP_06 A6 ... NaN

5 20180508_223000 20180509_013000 APCP_06 A6 ... NaN

5 20180509_223000 20180510_013000 APCP_06 A6 ... NaN

5 20180510_223000 20180511_013000 APCP_06 A6 ... NaN

5 20180511_223000 20180512_013000 APCP_06 A6 ... NaN

5 20180512_223000 20180513_013000 APCP_06 A6 ... NaN

5 20180513_223000 20180514_013000 APCP_06 A6 ... NaN

5 20180514_223000 20180515_013000 APCP_06 A6 ... NaN

5 20180515_223000 20180516_013000 APCP_06 A6 ... NaN

5 20180516_223000 20180517_013000 APCP_06 A6 ... NaN

5 20180517_223000 20180518_013000 APCP_06 A6 ... NaN

5 20180518_223000 20180519_013000 APCP_06 A6 ... NaN

5 20180519_223000 20180520_013000 APCP_06 A6 ... NaN

5 20180520_223000 20180521_013000 APCP_06 A6 ... NaN

5 20180521_223000 20180522_013000 APCP_06 A6 ... NaN

EDI_BCU SEDI SEDI_NCL SEDI_NCU SEDI_BCL SEDI_BCU BAGSS BAGSS_BCL BAGSS_BCU

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

5 NaN NaN NaN NaN NaN NaN NaN NaN NaN

[16 rows x 114 columns]

df.mean()的输出结果长这样
COV_THRESH NaN
ALPHA 0.050000
BASER 0.000047
BASER_NCL 0.000008
BASER_NCU 0.001521
BASER_BCL 0.000000
BASER_BCU 0.000140
FMEAN 0.000094
FMEAN_NCL 0.000021
FMEAN_NCU 0.001601
FMEAN_BCL 0.000000
FMEAN_BCU 0.000257
ACC 0.999861
ACC_NCL 0.998312
ACC_NCU 0.999969
ACC_BCL 0.999603
ACC_BCU 1.000000

1个回答

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python pandas排序问题
原始数据的excel表格,如下图 ![图片说明](https://img-ask.csdn.net/upload/202001/15/1579088832_399765.png) 想用python的pandas把excel变成按相同地点和按相同地点的数量由大到小排序,如下图 ![图片说明](https://img-ask.csdn.net/upload/202001/16/1579150058_389867.png)
pandas的dataframe的同一id的多行数据按其中一个特征将数据平铺该怎么简洁操作?
![图片说明](https://img-ask.csdn.net/upload/202001/15/1579069054_942084.png) 问题描述的效果如上图所示,python里有什么函数有这功能或有什么简洁高效的代码可以实现呢?
报错Traceback (most recent call last): File... .format(val=len(data), ind=len(index))) ValueError: Length of passed values is 400, index implies 1
我是个小菜鸟,在尝试写生成高斯分布的作业时被报错: ``` D:\Anaconda\python.exe "F:/All tasks in BFU/Study abroad/Internship2019.8 in Google/Homework/Course1/Exercise6/exercise6.py" Traceback (most recent call last): File "F:/All tasks in BFU/Study abroad/Internship2019.8 in Google/Homework/Course1/Exercise6/exercise6.py", line 20, in <module> y = func(x, mean, std) File "F:/All tasks in BFU/Study abroad/Internship2019.8 in Google/Homework/Course1/Exercise6/exercise6.py", line 15, in func f = math.exp(-((x - mu) ^ 2)/(2*sigma ^ 2))/(sigma * math.sqrt(2 * math.pi)) File "D:\Anaconda\lib\site-packages\pandas\core\ops.py", line 1071, in wrapper index=left.index, name=res_name, dtype=None) File "D:\Anaconda\lib\site-packages\pandas\core\ops.py", line 980, in _construct_result out = left._constructor(result, index=index, dtype=dtype) File "D:\Anaconda\lib\site-packages\pandas\core\series.py", line 262, in __init__ .format(val=len(data), ind=len(index))) ValueError: Length of passed values is 400, index implies 1 Process finished with exit code 1 ``` 我有安装anaconda,但是报错中貌似表明panda这个package的问题。请问大神大佬,我存在什么问题呀应该怎么解决⊙︿⊙,我好像没在网上找到和我一样的问题,不敢和网上的回答一样在命令提示符里输入命令怕搞错(。•́︿•̀。),是我比较菜鸟又急着所以麻烦了!! 附上我的作业代码: ``` import math import pandas as pd import numpy as np import matplotlib.pyplot as plt # import matplotlib.mlab as mlb data = pd.read_csv('example-exercise6.csv') # read file of data # data = data_['time'] mean = data.mean() # average of data std = data.std() # std def func(x, mu, sigma): f = math.exp(-((x - mu) ^ 2)/(2*sigma ^ 2))/(sigma * math.sqrt(2 * math.pi)) return f x = np.arange(60, 100, 0.1) y = func(x, mean, std) plt.plot(x, y) plt.hist(data, bins=10, rwidth=0.9, normed=True) # x = np.arange(145, 155,0.2) # y = normfun(x, mean, std) # plt.plot(x,y,'g',linewidth = 3) # plt.hist(data, bins = 6, color = 'b', alpha=0.5, rwidth = 0.9, normed=True) # plt.title('stakes distribution') # plt.xlabel('stakes time') # plt.ylabel('Probability') plt.show() ``` ( 其中csv文件是:) ``` 87 88 83 83 86 80 84 90 84 80 94 89 76 ```
pandas如何简单实现excel中的countif函数?
![图片说明](https://img-ask.csdn.net/upload/201905/10/1557489389_301017.png) 如图所示,我需要统计每行中比指标值大的列的个数。。excel很容易用countif函数来计数。。 但是我用pandas死活搞不出结果来。。 我的代码是: np.where(data[data.columns[1:]]> data['指标']).count(1) ---结果都是0 用: (data[data.columns[1:]]> data['指标']).sum() ---结果也是0 求指点迷津
Python3中pandas批量汇总多个Excel文件,如何将中文日期命名的文件名变成数字日期并写入Excel第一行?
文件名:2019年11月1日.xlsx~2019年11月30日.xlsx,文件里面数据没有标识日期,汇总后数据混乱,我需要把文件名改为数字日期并放在Excel第一行。 每个Excel中有多个工作表,初学Python,请各位指点。 代码如下 ``` ``` import pandas as pd import os import re list2 = os.listdir(r'c:\python\2019年11月\\') list1 = [] for name in list2: if re.findall('^2019年11月\d+日.xlsx', name): list1.append(name) # print(list1) dflist = [] for i in range(len(list1)): dflist.append(pd.read_excel(list1[i], header=2)) # print(dflist) data = pd.concat(dflist) data.to_excel('./123.xlsx') # 数据保存路径
pandas关于csv的读取和写入问题
1、利用pandas.read_csv读取数据后再用pandas.to_csv写入数据,在新写入的数据里,多出了一行是为什么呢?对比了一下读取的和写入的数据,差别在于,写入的数据在中间多出一行空白行。 ``` import pandas as pd train=pd.read_csv(r'F:\data1\train.tsv', sep='\t',header=0) train.to_csv(r'F:\data2\train2.tsv', encoding='utf_8_sig',sep='\t', header=False,index=True) ``` 读入的数据是:![图片说明](https://img-ask.csdn.net/upload/201911/13/1573642507_391031.png) 写入后的数据是:![图片说明](https://img-ask.csdn.net/upload/201911/13/1573642607_667954.png)
pandas的shift函数不起作用,如截图
![图片说明](https://img-ask.csdn.net/upload/201907/27/1564192320_599780.png) 如图,执行shift函数后,数据无变化。
python pd.merge()合并后的DataFrame无法输出到excel表
代码: import pandas as pd from pandas import DataFrame df3 = DataFrame({'key1': ['one', 'two', 'three', 'two'], 'key2': ['two', 'three', 'one', 'one'], 'data': [1, 2, 3, 4]}) df4 = DataFrame({'key1': ['two', 'two', 'three'], 'key2': ['one', 'two', 'one'], 'data': [1, 2, 3]}) data = pd.merge(df3, df4, on=['key1', 'key2'], how='outer') print(data) data.to_excel('D:\01.xls', na_rep=None) 结果: key1 key2 data_x data_y 0 one two 1.0 NaN 1 two three 2.0 NaN 2 three one 3.0 3.0 3 two one 4.0 1.0 4 two two NaN 2.0 Traceback (most recent call last): File "D:/python项目/02.py", line 232, in <module> data.to_excel('D:\01.xls', na_rep=None) File "F:\python\lib\site-packages\pandas\core\generic.py", line 2256, in to_excel engine=engine, File "F:\python\lib\site-packages\pandas\io\formats\excel.py", line 742, in write writer.save() File "F:\python\lib\site-packages\pandas\io\excel\_xlwt.py", line 32, in save return self.book.save(self.path) File "F:\python\lib\site-packages\xlwt\Workbook.py", line 710, in save doc.save(filename_or_stream, self.get_biff_data()) File "F:\python\lib\site-packages\xlwt\CompoundDoc.py", line 262, in save f = open(file_name_or_filelike_obj, 'w+b') OSError: [Errno 22] Invalid argument: 'D:\x01.xls' 为什么会报错呢?两个DataFrame使用merge方法合并后不是变成一个DataFrame了吗,为什么使用to_excel方法会出现错误?
python pandas用函数算距离时报错
在网上copy来的一个算经纬度的方法,但在实际操作运行到 lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2]) 的时候到报错:”TypeError: cannot convert the series to <class 'float'》,显示series不能转换为float,请问下各位大佬这个问题怎么解决 需要怎么修改脚本。 ``` import numpy as np import pandas as pd test_data = pd.DataFrame(pd.read_excel("test.xlsx")) def haversine(lon1, lat1, lon2, lat2): # 经度1,纬度1,经度2,纬度2 """函数作用:计算两个经纬度之间的距离""" # 将十进制度数转化为弧度 lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2]) # haversine公式 dlon = lon2 - lon1 dlat = lat2 - lat1 a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2 c = 2 * asin(sqrt(a)) r = 6371 # 地球平均半径,单位为公里 return c * r * 1000 test_data["距离(米)"] = test_data.eval('@haversine(经度,纬度,Longitude,Latitude)') """ 表内容举例: name 经度 纬度 Longitude Latitude A 113.545761 23.106667 113.09461 23.39367 B 113.545761 23.106667 113.173833 23.336054 C 113.545761 23.106667 113.1799 23.43946 D 113.545761 23.106667 113.1975278 23.38591667 E 113.545761 23.106667 113.1975278 23.38591667 F 113.545761 23.106667 113.219664 23.100377 G 113.545761 23.106667 113.219664 23.100377 H 113.545761 23.106667 113.22253 23.18483 I 113.545761 23.106667 113.22253 23.18483 """ ``` 程序运行到
请问为什么当我试图储存爬到的多个页面的数据时,只能保存最后一页的数据
import pandas as pd import re import requests from requests import RequestException from bs4 import BeautifulSoup def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" for i in range(2,5): url = "https://bj.lianjia.com/xiaoqu/pg" + str(i) +"/?from=rec" print(url) html = getHTMLText(url) pattern = re.compile('<div class="title">.*?<a href="https://bj.lianjia.com/xiaoqu.*?/".*?target="_blank">(.*?)</a>.*?<div class="totalPrice"><span>(.*?)</span>', re.S) items = re.findall(pattern, html) print(items) name = [] price = [] info = [] for item in items: print(item) name.append(item[0]) name price.append(item[1]) info = list(zip(name,price)) headers = ['小区', '价格'] filen_name = 'C:\\Users\\86157\\Desktop\\1.csv' data3 = pd.DataFrame(columns = headers,data = info) data3.to_csv(file_name, encoding='utf_8_sig') pd.read_csv(file_name) 这是我写的代码 ``` ```
一个有关pandas 中 Rolling_apply函数的问题
有关这个函数,我已经察看了pandas的手册,但是由于缺乏例子,还是有些没明白 首先,这个函数通过内部参数func 对某个dataframe向指定函数进行Rollingwindos的运算 我想知道 他每次向这个函数传递的参数是什么 如何能传递多个参数,其次可以获得什么数据类型的返回值 这里我提供一个例子 比如有个DataFrame变量data 格式如下 time price volume 21:00:00 1000 10 21:00:01 999 5 21:00:02 998 4 21:00:03 998 3 21:00:04 996 11 21:00:05 995 13 我想能生成一列 用来计算2秒内price 的Volume加权平均
使用pandas模块保存的图片日期不更新
问题: 使用pandas模块保存的图片日期不更新 代码: ![图片说明](https://img-ask.csdn.net/upload/201907/23/1563870095_779425.png) 在图片保存的目录下查看: ![图片说明](https://img-ask.csdn.net/upload/201907/23/1563870204_907505.png) 结果: 这张图片我在15:55的时候生成过,现在16:14再生成一次时间点还显示的是15:55,但是图片里面的内容确实是16:14的内容 请问为啥图片日期不会自动更新啊?
Python pandas 读取Excel文件
Excel a.xlsx数据格式为: ['K52', 'B36', 'J06', 'J11'](这是第一行第一个单元格) ['Z01', 'K07', 'J11', 'K07'](这是第二行第一个单元格) ['K02', 'J06', 'J40', 'J40', 'J40', 'J40', 'J40', 'J11', 'J06', 'J06', 'A49', 'J06', 'J06'] ['I51', 'K82', 'Z34', 'N61', 'J11'] ['D22', 'J11', 'S02', 'K04', 'N76', 'N83'] 一共5行,1列 想要变成的数组格式为: data = [ ['K52', 'B36', 'J06', 'J11'], ['Z01', 'K07', 'J11', 'K07'], ['K02', 'J06', 'J40', 'J40', 'J40', 'J40', 'J40', 'J11', 'J06', 'J06', 'A49', 'J06', 'J06'], ['I51', 'K82', 'Z34', 'N61', 'J11'], ['D22', 'J11', 'S02', 'K04', 'N76', 'N83'] ] 不要有NAN的数据
python pandas安装遇到问题怎么办?
请问我安装pandas时总是安装不了,在官网上下载了pandas pip 那个文件以后能安装,但是后面还会再有一个安装。就卡在第二个安装上,而且,直接pip install pandas也会出现同样问题。![图片说明](https://img-ask.csdn.net/upload/201911/05/1572939128_215195.png) ![图片说明](https://img-ask.csdn.net/upload/201911/05/1572939178_715990.png)
KeyError: 'sepallength'问题
Traceback (most recent call last): File "F:\Anaconda\lib\site-packages\pandas\core\indexes\base.py", line 2657, in get_loc return self._engine.get_loc(key) File "pandas/_libs/index.pyx", line 108, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/hashtable_class_helper.pxi", line 1601, in pandas._libs.hashtable.PyObjectHashTable.get_item File "pandas/_libs/hashtable_class_helper.pxi", line 1608, in pandas._libs.hashtable.PyObjectHashTable.get_item KeyError: 'sepallength' During handling of the above exception, another exception occurred: Traceback (most recent call last): File "C:/Users/Shinelon/PycharmProjects/datamining/ShuJuWaJue/knnData.py", line 119, in <module> plt.scatter(x=t0['sepallength'][:50], y=t0['petallength'][:50], color='r', label='Iris-virginica') File "F:\Anaconda\lib\site-packages\pandas\core\frame.py", line 2927, in __getitem__ indexer = self.columns.get_loc(key) File "F:\Anaconda\lib\site-packages\pandas\core\indexes\base.py", line 2659, in get_loc return self._engine.get_loc(self._maybe_cast_indexer(key)) File "pandas/_libs/index.pyx", line 108, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/hashtable_class_helper.pxi", line 1601, in pandas._libs.hashtable.PyObjectHashTable.get_item File "pandas/_libs/hashtable_class_helper.pxi", line 1608, in pandas._libs.hashtable.PyObjectHashTable.get_item KeyError: 'sepallength' 今天做鸢尾花数据的knn算法实验发生以下问题,请问哪里有问题啊,一直找不出来
就剩这个问题没解决了:TypeError: 'function' object is not subscriptable拜托请教大家!
![图片说明](https://img-ask.csdn.net/upload/201912/07/1575709842_231822.png)![图片说明](https://img-ask.csdn.net/upload/201912/07/1575709860_77315.png) import pandas as pd import numpy as np from GM11 import GM11 # 引入自己编写的灰色预测函数 data = pd.read_csv('D:\\软件\\python\\《Python数据分析与挖掘实战(张良均等)》中文PDF+源代码\\' '《Python数据分析与挖掘实战(张良均等)》中文PDF+源代码\\数据及代码\\chapter13\\test\\data\\data1.csv',engine='python') data.index = range(1994,2014) data data.loc[2014] = None data.loc[2015] = None h = ['x1', 'x2', 'x3', 'x4', 'x5', 'x7'] P = [] C = [] for i in h: gm = GM11(data[i][:-2].values)[0] # 利用返回的灰色预测函数,仅和对对应期数及位置有关 f = gm([0] ) ##获得灰色预测函数 P = gm[-1] # 获得小残差概率 C = gm[-2] # 获得后验比差值 data[i][2014] = f(len(data) - 1) data[i][2015] = f(len(data)) data[i] = data[i].round(2) if (C < 0.35 and P > 0.95): # 评测后验差判别 print( '对于模型%s,该模型精度为---好' % i) elif (C < 0.5 and P > 0.8): print('对于模型%s,该模型精度为---合格' % i) elif (C < 0.65 and P > 0.7): print('对于模型%s,该模型精度为---勉强合格' % i) else: print('对于模型%s,该模型精度为---不合格' % i) data[h + ['y']].to_excel('D:\\软件\\python\\《Python数据分析与挖掘实战(张良均等)》中文PDF+源代码\\' '《Python数据分析与挖掘实战(张良均等)》中文PDF+源代码\\数据及代码\\chapter13\\test\\data\\2_1_2_1greyPredict(最新5).xlsx') 补充: gm为自定义函数: def GM11(x0): #自定义灰色预测函数 import numpy as np x1 = x0.cumsum() #1-AGO序列 z1 = (x1[:len(x1)-1] + x1[1:])/2.0 #紧邻均值(MEAN)生成序列 z1 = z1.reshape((len(z1),1)) B = np.append(-z1, np.ones_like(z1), axis = 1) Yn = x0[1:].reshape((len(x0)-1, 1)) [[a],[b]] = np.dot(np.dot(np.linalg.inv(np.dot(B.T, B)), B.T), Yn) #计算参数 f = lambda k: (x0[0]-b/a)*np.exp(-a*(k-1))-(x0[0]-b/a)*np.exp(-a*(k-2)) #还原值 delta = np.abs(x0 - np.array([f(i) for i in range(1,len(x0)+1)])) C = delta.std()/x0.std() P = 1.0*(np.abs(delta - delta.mean()) < 0.6745*x0.std()).sum()/len(x0) return f, a, b, x0[0], C, P #返回灰色预测函数、a、b、首项、方差比、小残差概率
为什么我的pyecharts柱形图表部署在flask后,横坐标由原来的文字标签变成数字了?
求助各位大佬!我是一个pyecharts小白,下面是我用flask部署pyecharts的代码。 ``` import pandas as pd from flask import Flask, render_template from pyecharts import options as opts from pyecharts.charts import Bar from pyecharts.charts import Timeline from pyecharts.charts import Pie app = Flask(__name__, static_folder="templates") data总=pd.read_csv('datazong.csv',encoding='utf-8') zuojia = pd.read_csv('zuojia.csv',encoding='gbk') X轴=[str(x) for x in zuojia.loc[:,'网络作家']] Y轴=[str(x) for x in zuojia.loc[:,'版税收入(万元)']] def bar_datazoom_inside() -> Timeline: tl = Timeline() for i in range(2014, 2020): c = ( Bar() .add_xaxis(list(zip(list(data总.index)))) .add_yaxis("显示",list(data总["{}".format(i)])) .set_global_opts( title_opts=opts.TitleOpts(title="纵横小说月票榜"), datazoom_opts=opts.DataZoomOpts(type_="inside"), visualmap_opts=opts.VisualMapOpts(type_="color", max_=250000, min_=200,pos_right='20',pos_top='middle'), toolbox_opts=opts.ToolboxOpts(), ) .set_series_opts( label_opts=opts.LabelOpts(is_show=False), markpoint_opts=opts.MarkPointOpts( data=[ opts.MarkPointItem(type_="max", name="最大值"), opts.MarkPointItem(type_="min", name="最小值"), ] ), ) ) tl.add(c, "{}年".format(i)) return tl def pie_rosetype() -> Pie: c = ( Pie() .add( "", [list(z) for z in zip(X轴, Y轴)], radius=["30%", "60%"], center=["50%", "60%"], rosetype="area", ) .set_global_opts(title_opts=opts.TitleOpts(title="2018作家版税收入榜单",pos_top = 'middle')) .set_series_opts( label_opts=opts.TextStyleOpts(font_style='oblique') ) ) return c @app.route("/") def index(): return render_template("index.html") @app.route("/barChart") def get_bar_chart(): tl = bar_datazoom_inside() return tl.dump_options_with_quotes() @app.route("/2") def index2(): return render_template("index2.html") @app.route("/barChart2") def get_bar_chart2(): c = pie_rosetype() return c.dump_options_with_quotes() if __name__ == "__main__": app.run() ``` 代码没问题,也能够将网站部署出来,如下图: ![flask](https://img-ask.csdn.net/upload/201912/29/1577606001_509738.png) 但是!我的横坐标变成数字了,原来在jupyter简单的render后产生的可视化横坐标是正常的如: ![图片说明](https://img-ask.csdn.net/upload/201912/29/1577606183_550451.png) 请各位大佬帮帮忙,我实在搞不明白哪里出错了。 下面是我的index.html代码。 ``` <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>Awesome-pyecharts</title> <script src="https://cdn.bootcss.com/jquery/3.0.0/jquery.min.js"></script> <script type="text/javascript" src="https://assets.pyecharts.org/assets/echarts.min.js"></script> </head> <body> <div id="bar" style="width:1000px; height:600px;"></div> <script> $( function () { var chart = echarts.init(document.getElementById('bar'), 'white', {renderer: 'canvas'}); $.ajax({ type: "GET", url: "http://127.0.0.1:5000/barChart", dataType: 'json', success: function (result) { chart.setOption(result); } }); } ) </script> </body> </html> ```
pandas读取excel的中文列名时出现错误
```py path1='D:\experiment' xlsx_names = [x for x in os.listdir(path1) if x.endswith(".xlsx")] #读取以xlsx结尾的文件 print(xlsx_names) df_data = None for xlsx_name in xlsx_names: path=os.path.join(path1,xlsx_name) print(path) df = pd.read_excel(path, sheet_name='订单明细') print(df) print(df['客户所在城市(地级市)']) print(df['商品件数(件数)']) ``` KeyError: '客户所在城市(地级市)' 不能打印出来,有没有人知道怎么回事
执行pip install pandas_datareader出错?
C:\WINDOWS\system32>pip install pandas_datareader Collecting pandas_datareader Using cached https://files.pythonhosted.org/packages/14/52/accb990baebe0063977f26e02df36aa7eb4015ed4e86f828cd76273cd6f1/pandas_datareader-0.8.1-py2.py3-none-any.whl Requirement already satisfied: pandas>=0.21 in c:\users\administrator\appdata\local\programs\python\python35\lib\site-packages (from pandas_datareader) (0.25.2) ERROR: Package 'pandas' requires a different Python: 3.5.2 not in '>=3.5.3' ``` ```
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它是一个过程,是一个不断累积、不断沉淀、不断总结、善于传达自己的个人见解以及乐于分享的过程。
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 free -m 其中:m表示兆,也可以用g,注意都要小写 Men:表示物理内存统计 total:表示物理内存总数(total=used+free) use...
比特币原理详解
一、什么是比特币 比特币是一种电子货币,是一种基于密码学的货币,在2008年11月1日由中本聪发表比特币白皮书,文中提出了一种去中心化的电子记账系统,我们平时的电子现金是银行来记账,因为银行的背后是国家信用。去中心化电子记账系统是参与者共同记账。比特币可以防止主权危机、信用风险。其好处不多做赘述,这一层面介绍的文章很多,本文主要从更深层的技术原理角度进行介绍。 二、问题引入 假设现有4个人...
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发...
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 演示地点演示 html代码如下` music 这个年纪 七月的风 音乐 ` 然后就是css`*{ margin: 0; padding: 0; text-decoration: none; list-...
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。
数据库优化 - SQL优化
以实际SQL入手,带你一步一步走上SQL优化之路!
通俗易懂地给女朋友讲:线程池的内部原理
餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”
经典算法(5)杨辉三角
杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。
使用 Docker 部署 Spring Boot 项目
Docker 技术发展为微服务落地提供了更加便利的环境,使用 Docker 部署 Spring Boot 其实非常简单,这篇文章我们就来简单学习下。首先构建一个简单的 S...
英特尔不为人知的 B 面
从 PC 时代至今,众人只知在 CPU、GPU、XPU、制程、工艺等战场中,英特尔在与同行硬件芯片制造商们的竞争中杀出重围,且在不断的成长进化中,成为全球知名的半导体公司。殊不知,在「刚硬」的背后,英特尔「柔性」的软件早已经做到了全方位的支持与支撑,并持续发挥独特的生态价值,推动产业合作共赢。 而对于这一不知人知的 B 面,很多人将其称之为英特尔隐形的翅膀,虽低调,但是影响力却不容小觑。 那么,在...
面试官:你连RESTful都不知道我怎么敢要你?
干货,2019 RESTful最贱实践
刷了几千道算法题,这些我私藏的刷题网站都在这里了!
遥想当年,机缘巧合入了 ACM 的坑,周边巨擘林立,从此过上了"天天被虐似死狗"的生活… 然而我是谁,我可是死狗中的战斗鸡,智力不够那刷题来凑,开始了夜以继日哼哧哼哧刷题的日子,从此"读题与提交齐飞, AC 与 WA 一色 ",我惊喜的发现被题虐既刺激又有快感,那一刻我泪流满面。这么好的事儿作为一个正直的人绝不能自己独享,经过激烈的颅内斗争,我决定把我私藏的十几个 T 的,阿不,十几个刷题网...
白话阿里巴巴Java开发手册高级篇
不久前,阿里巴巴发布了《阿里巴巴Java开发手册》,总结了阿里巴巴内部实际项目开发过程中开发人员应该遵守的研发流程规范,这些流程规范在一定程度上能够保证最终的项目交付质量,通过在时间中总结模式,并推广给广大开发人员,来避免研发人员在实践中容易犯的错误,确保最终在大规模协作的项目中达成既定目标。 无独有偶,笔者去年在公司里负责升级和制定研发流程、设计模板、设计标准、代码标准等规范,并在实际工作中进行...
SQL-小白最佳入门sql查询一
不要偷偷的查询我的个人资料,即使你再喜欢我,也不要这样,真的不好;
redis分布式锁,面试官请随便问,我都会
文章有点长并且绕,先来个图片缓冲下! 前言 现在的业务场景越来越复杂,使用的架构也就越来越复杂,分布式、高并发已经是业务要求的常态。像腾讯系的不少服务,还有CDN优化、异地多备份等处理。 说到分布式,就必然涉及到分布式锁的概念,如何保证不同机器不同线程的分布式锁同步呢? 实现要点 互斥性,同一时刻,智能有一个客户端持有锁。 防止死锁发生,如果持有锁的客户端崩溃没有主动释放锁,也要保证锁可以正常释...
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
Nginx 原理和架构
Nginx 是一个免费的,开源的,高性能的 HTTP 服务器和反向代理,以及 IMAP / POP3 代理服务器。Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。 Nginx 的整体架构 Nginx 里有一个 master 进程和多个 worker 进程。master 进程并不处理网络请求,主要负责调度工作进程:加载配置、启动工作进程及非停升级。worker 进程负责处...
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,...
程序员:我终于知道post和get的区别
是一个老生常谈的话题,然而随着不断的学习,对于以前的认识有很多误区,所以还是需要不断地总结的,学而时习之,不亦说乎
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU...
加快推动区块链技术和产业创新发展,2019可信区块链峰会在京召开
11月8日,由中国信息通信研究院、中国通信标准化协会、中国互联网协会、可信区块链推进计划联合主办,科技行者协办的2019可信区块链峰会将在北京悠唐皇冠假日酒店开幕。   区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术。如果说蒸汽机释放了人类的生产力,电力解决了人类基本的生活需求,互联网彻底改变了信息传递的方式,区块链作为构造信任的技术有重要的价值。   1...
Java世界最常用的工具类库
Apache Commons Apache Commons有很多子项目 Google Guava 参考博客
程序员把地府后台管理系统做出来了,还有3.0版本!12月7号最新消息:已在开发中有github地址
第一幕:缘起 听说阎王爷要做个生死簿后台管理系统,我们派去了一个程序员…… 996程序员做的梦: 第一场:团队招募 为了应对地府管理危机,阎王打算找“人”开发一套地府后台管理系统,于是就在地府总经办群中发了项目需求。 话说还是中国电信的信号好,地府都是满格,哈哈!!! 经常会有外行朋友问:看某网站做的不错,功能也简单,你帮忙做一下? 而这次,面对这样的需求,这个程序员...
网易云6亿用户音乐推荐算法
网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过 AI 算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。 本次分享重点介绍 AI 算法在音乐推荐中的应用实践,以及在算法落地过程中遇到的挑战和解决方案。 将从如下两个部分展开: AI算法在音乐推荐中的应用 音乐场景下的 AI 思考 从 2013 年 4 月正式上线至今,网易云音乐平台持续提供着:乐屏社区、UGC...
【技巧总结】位运算装逼指南
位算法的效率有多快我就不说,不信你可以去用 10 亿个数据模拟一下,今天给大家讲一讲位运算的一些经典例子。不过,最重要的不是看懂了这些例子就好,而是要在以后多去运用位运算这些技巧,当然,采用位运算,也是可以装逼的,不信,你往下看。我会从最简单的讲起,一道比一道难度递增,不过居然是讲技巧,那么也不会太难,相信你分分钟看懂。 判断奇偶数 判断一个数是基于还是偶数,相信很多人都做过,一般的做法的代码如下...
为什么要学数据结构?
一、前言 在可视化化程序设计的今天,借助于集成开发环境可以很快地生成程序,程序设计不再是计算机专业人员的专利。很多人认为,只要掌握几种开发工具就可以成为编程高手,其实,这是一种误解。要想成为一个专业的开发人员,至少需要以下三个条件: 1) 能够熟练地选择和设计各种数据结构和算法 2) 至少要能够熟练地掌握一门程序设计语言 3) 熟知所涉及的相关应用领域的知识 其中,后两个条件比较容易实现,而第一个...
Android 9.0 init 启动流程
阅读五分钟,每日十点,和您一起终身学习,这里是程序员Android本篇文章主要介绍Android开发中的部分知识点,通过阅读本篇文章,您将收获以下内容:一、启动流程概述一、 启动流程概述Android启动流程跟Linux启动类似,大致分为如下五个阶段。1.开机上电,加载固化的ROM。2.加载BootLoader,拉起Android OS。3.加载Uboot,初始外设,引导Kernel启动等。...
相关热词 c#中dns类 c#合并的excel c# implicit c#怎么保留3个小数点 c# 串口通信、 网络调试助手c# c# 泛型比较大小 c#解压分卷问题 c#启动居中 c# 逻辑或运算符
立即提问