一曲封尘 2022-10-13 21:17 采纳率: 33.3%
浏览 35
已结题

提取最后一个方括号里的内容(有嵌套),shell,python

问题遇到的现象和发生背景

1.在一个数据库中提取物种名称,但是遇到复杂的中括号嵌套的情况。
而我只需要最后一个方括号里的内容,有些方括号里面有嵌套(整条字符串如图,我只想要截取我画了白线的最后一个方括号里的内容)
2.数据量很大,上亿条,如果可以最好有快速一点的方法,没有也没关系。
3.如果有的行很复杂不太好实现,能提取大部分行的就好
一开始用shell,但是知识太浅薄莫有想到很好的解决方法。

img

BAX96271.1 hypothetical protein MSTE_00936 [[Mycobacterium] stephanolepidis]
OGT92901.1 methylenetetrahydrofolate reductase [NAD(P)H] [Gammaproteobacteria bacterium RIFOXYA12_FULL_61_12]
NHB59397.1 methylated-DNA--[protein]-cysteine S-methyltransferase [Acinetobacter shaoyimingii]
EDV2009001.1 two component system sensor kinase [Salmonella enterica subsp. enterica serovar 4,[5],12:i:-]

用代码块功能插入代码,请勿粘贴截图

cat file | awk -F "[" '{print $2}'

运行结果及报错内容

只能截取无嵌套且有且只有一个方括的行。

我想要达到的结果

折腾了好久了,刚刚看了堆栈的方法但是还是不弄。shell,python、perl都可以

  • 写回答

1条回答 默认 最新

  • xiaotanggao 2022-10-14 14:34
    关注

    我用python写的

    def findOffset(str,offset):
        # 找到最后一个[的index
        index = str.find('[', offset, len(str))
    
        # 取出最后一个[ 和 ] 之间的内容
        tmpstr = str[offset:index+1]
        # 如果最后一个[ 和 ] 之间存在] 说明没取成功
        if tmpstr.find(']', 1, len(tmpstr)) != -1:
            findOffset(str, index+1)
        else:
            print(str[index::-1])
    
    
    f = open("1.txt", "r")
    
    for line in f.readlines():
        reversed_line = line.strip()[::-1]
        findOffset(reversed_line, 0)
    
    f.close()
    
    

    效果

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月22日
  • 已采纳回答 10月14日
  • 创建了问题 10月13日

悬赏问题

  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料
  • ¥15 使用R语言marginaleffects包进行边际效应图绘制