有一个dataframe,其中一列为:
index |
---|
AB102; AS129; ASKX |
ASKX |
…… |
AS129; A8SZ |
AS129 |
我想先用“; ”分割出每个字符,然后再提取所有出现过的值(去重),也就是:
[AB102, AS129, ASKX, A8SZ]
有一个dataframe,其中一列为:
index |
---|
AB102; AS129; ASKX |
ASKX |
…… |
AS129; A8SZ |
AS129 |
我想先用“; ”分割出每个字符,然后再提取所有出现过的值(去重),也就是:
[AB102, AS129, ASKX, A8SZ]
可以用set去重,然后再转成list:
s = set()
for string in df['index']:
for sub in string.split('; '):
s.add(sub)
# l = list(s)