有一个dataframe,其中一列为:
index |
---|
AB102&AB129; ABKX |
AB102 |
…… |
AS129; A8SZ |
AB102&AB129 |
我想先用“; ”分割出字符串,然后再提取所有AB出现过的字符串数量,也就是:
index |
---|
2 |
1 |
…… |
0 |
1 |
第一行AB出现三次,但是"; "分割成两个字符串,每个字符串都出现一次,所以算两次。
有一个dataframe,其中一列为:
index |
---|
AB102&AB129; ABKX |
AB102 |
…… |
AS129; A8SZ |
AB102&AB129 |
我想先用“; ”分割出字符串,然后再提取所有AB出现过的字符串数量,也就是:
index |
---|
2 |
1 |
…… |
0 |
1 |
第一行AB出现三次,但是"; "分割成两个字符串,每个字符串都出现一次,所以算两次。
split = df['index'].str.split('; ') # 分割字符串
df['count'] = split.apply(lambda x : len([i for i in x if 'AB' in i])) # 创建新的列