端午吃饱没 2023-02-03 18:20 采纳率: 57.9%
浏览 60
已结题

Python查找一列中字符出现频率

我有一个dataframe,其中一列为

number
CN102A FB
AS9120 DS; 8T12A FA
……
CN102A FB; AT12A FB

我想得到这列每行的如下信息:

  1. "; "分割的字符串数量
  2. 字符串开头为CN或者AT的数量
  3. 字符串含有FB的数量

最后将信息组成新的dataframe,拼在原来的后面:

"; "分割开头为CN或者AT含有FB
111
200
………………
222

我现在只能写出前两个,且不会拼接为新的dataframe。求解!

for row in range(len(df)):
    temp_list = df.loc[row, "number"].split(";  ")
    temp_list2 =  temp_list .value_counts(list(map(lambda x: x[:2], temp_list)))
  • 写回答

2条回答 默认 最新

  • P2441M 2023-02-03 18:41
    关注

    为什么最后还要拼接为新的dataframe?直接用下标运算符设置值不就行了吗:

    df['"; "分割'] = df['number'].str.count('; ') + 1
    df['开头为CN或者AT'] = df['number'].str.count('^(CN|AT)')
    df['含有FB'] = df['number'].str.count('FB')
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月4日
  • 已采纳回答 2月24日
  • 修改了问题 2月3日
  • 创建了问题 2月3日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题