问题遇到的现象和发生背景
在进行网页路径分析时想要将一些第一列字符串类似(比如abcde与abcdf,abcd这个前缀相同)的行求和
用代码块功能插入代码,请勿粘贴截图。 不用代码块回答率下降 50%
import pandas as pd
import numpy as np
df = pd.read_csv(r'C:\Users\Leo90\Downloads\data-export.csv',encoding='utf-8', header=None, sep='\n')
df = df[0].str.split(',', expand=True)
df=df.iloc[:,[0,1,2,3,4,5,6,7]]
df=df.replace(to_replace='None',value=np.nan).dropna()
df=df.reset_index(drop=True)
columnNames = df.iloc[0]
df = df[1:]
df.columns = columnNames
df.groupby('网页路径和屏幕类').head()
运行结果及详细报错内容
我的解答思路和尝试过的方法,不写自己思路的,回答率下降 60%
想要使用str.contain来合并相似列,但这样只能一种前缀合并一次且不知道该怎么求和(用SUM是不是可以呀)
我想要达到的结果,如果你需要快速回答,请尝试 “付费悬赏”
有许多个类似前缀的列我想要将他们分组行求和,将这几千行数据转化为几十行合并后的数据