qq_51636884 2023-04-18 15:32 采纳率: 88.9%
浏览 19
已结题

如何在jupyter notebook中用pandas对下面的第二列按照反斜杠提取内容(即如何将第二列以反斜杠为分隔符,将其分割成多个列),以及如何提取第四列中的数字

img

请问有没有人知道如何用pandas将第二列以反斜杆为分隔符,将其划分为多个列,以及如何提取第四列中的数字。


  • 写回答

2条回答 默认 最新

  • Dick_不周 2023-04-18 15:51
    关注
    import re
    import pandas as pd
    df = pd.DataFrame(columns = 'info,voet_count'.split(','))
    df.loc[len(df)] = ['余华/江南出版社/1990-27/20元','fasdf12345']
    print(df)
    df[['作者','出版社','出版时间','售价']] =[x.split('/') for x in df['info'].tolist()]
    df['voet_count'] =  [re.search('\d+',x).group() for x in df['voet_count'].tolist()]
    df1  = df[['作者','出版社','出版时间','售价','voet_count']]
    print('------------------------')
    print(df1)
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月27日
  • 已采纳回答 4月19日
  • 创建了问题 4月18日

悬赏问题

  • ¥20 keepalive配置业务服务双机单活的方法。业务服务一定是要双机单活的方式
  • ¥50 关于多次提交POST数据后,无法获取到POST数据参数的问题
  • ¥15 win10,这种情况怎么办
  • ¥15 如何在配置使用Prettier的VSCode中通过Better Align插件来对齐等式?(相关搜索:格式化)
  • ¥100 在连接内网VPN时,如何同时保持互联网连接
  • ¥15 MATLAB中使用parfor,矩阵Removal的有效索引在parfor循环中受限制
  • ¥20 Win 10 LTSC 1809版本如何无损提升到20H1版本
  • ¥50 win10 LTSC 虚拟键盘不弹出
  • ¥30 微信小程序请求失败,网页能正常带锁访问
  • ¥15 Matlab求解微分方程,如何用fish2d进行预优?