纯excel不高级使用者,因近期需要批量收集信息,用爬虫爬下来了一堆数据,但格式不太理想,为了让后续数据能被用于数据分析,需要进行转置和规范化,希望不吝赐教数据清洗的我
我的解答思路和尝试过的方法:用excel 手动进行转置
我想要达到的结果:通过python 或excel (Power BI) 或tableau 自动化地完成转置,大概有几千个相同格式的数据需要处理,实在无法手动进行。
第一行第一列(即图中的“抚州市”不动)
下面四行:
首先 “转置”( 如图excel ) 到第一行的后面
然后,需要手工删掉
下面的数据,每五行的操作跟之前一样,
详情请看图片和附表:
所属省(市) | 所属税务机关名称 | 失信主体名称 | 纳税人识别号 | 主体违法性质 |
---|---|---|---|---|
抚州市 | 资溪县续申药业有限公司 | 91361028MA361AC20 | 康水平 | 虚开增值税专用发票或者虚开用于骗取出口退税、抵扣税款的其他发票 |
资溪县续申药业有限公司 | ||||
91361028MA361AC20 | ||||
康水平 | ||||
虚开增值税专用发票或者虚开用于骗取出口退税、抵扣税款的其他发票 |