请在PyCharm中创建一个'Pandas_学号.py'文件,并利用Numpy、Pandas有关知识进行下列数据处理操作:
Step1. 利用Numpy读取数组的方法读取数据资料库中的data4_test.csv数据文件所有数据,并把读取的数据保存到变量Arr_Data中。
Step2. 将Arr_Data数组创建一个DataFrame结构数据数组,保存在变量DF中,并输出DataFrame的维数(ndim)、形状(shape)、数据类型(dtypes)、元素个数(size)。
Step3. 用Df的第一行数据创建Df列索引,输出Df的行索引和列索引。从Df中删除第1行数据,然后输出Df前后三行数据和数据长度。
Step4. 从Df中抽取XYDM为'DW_013'的所有数据,保存到变量'Df_DW_013'中。利用apply()函数将'JYXXMC'列中'待就业'和'其他暂不就业'的内容替换为'未就业',此列中其它内容替换为'已就业';将'JYD'列中在辽宁省内就业的数据替换为'省内就业',其它替换为'省外就业'。
Step5. 利用groupby()函数对Df_DW_013数据按字段['ZYMC','XB','XZ','JYD']进行分组,把每组数量的计算结果保存在'XH'列中。
Step6. 利用数据透视表功能创建行标签为['ZYMC','XB'],列标签为['JYD']的数据透视表或交叉表,表中缺失值用0填充。
Step7. 利用Df_DW_013_table数据绘制横向条形图,图大小为(12,6),图标题为'DW_013省内外就业统计图'。