Josh孙奕承 2022-12-14 16:19 采纳率: 90.9%
浏览 88
已结题

python 分隔符问题

CODE2中的内容是由一段编码+“|“+中文名称,但是其中可能有很多编码及其所属的中文,并被逗号分开,像第4行那样。现在想把CODE2中的所有编码保留下来,并分别变成名字1,2,3,4,5等等,编码的中文意义删掉。

img

我的思路:先把”逗号和“|”分号拆掉,并且自动分列,再把其中的中文意义列再drop掉
刚开始用split,但是split函数只能删除一个分隔符。之后使用rsplit函数,但是用了之后发现rsplit 不管怎么,都无法成功一下分解2个分隔符。
代码如下
c=a['code2'].str.rsplit('[,|]',expand=True)
运行结果及详细报错

img

我尝试了一下,需要好几个步骤
a=a['code2'].str.rsplit(',',expand=True)
c=a['code2'].rsplit('[,|]',expand=True)


b=a['code2'].str.split(',',expand=True)
b1=b[0].str.split('|',expand=True)

但是问题是如果这样做的话,原本与其相匹配的id_1和id_2就不见了,而起一起只能处理其中其中一列,如果有10列,过程过于繁琐。有没有简单的办法,又能直接从原来的表直接自动生成相关列?

img

img

  • 写回答

8条回答 默认 最新

  • 阳光宅男xxb 2022-12-14 16:29
    关注

    建议使用re.split 分隔符,或者你split两次也可以啊,先split | 然后在逗号

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(7条)

报告相同问题?

问题事件

  • 系统已结题 12月23日
  • 已采纳回答 12月15日
  • 修改了问题 12月14日
  • 修改了问题 12月14日
  • 展开全部

悬赏问题

  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line
  • ¥500 火焰左右视图、视差(基于双目相机)