赵灵越 2024-03-25 18:08 采纳率: 99.3%
浏览 1
已结题

文本处理,文本竖排清除标点符号,提取#标签#,和@谁,重新排版

文本处理,文本竖排清除标点符号,提取#标签#,和@谁,重新排版
这段文字是一位网络内容创作者在谈论自己的创作经历和挑战。他觉得创作很困难,因为他不知道写什么,也没有收入。他觉得自己没有擅长的领域,也没有学到什么写作技巧。他看到了一篇文章,建议创作者写自己喜欢的东西,但他还是觉得很难找到可写的内容。他认识到网络创作不容易赚钱,需要有技能或坚持下去。他认为坚持是成功的关键,无论是迅速走红还是慢慢积累粉丝。
#头条生活感受# 让我想起疫情期间成都三环边上两人戴口罩吵架,然后相互查了健康码、才摘下口罩互骂。[捂脸]#成人才懂的事# @今日头条青云计划


清理标点符号变成换行
>1行空行的空行=1个空行
提取文本#标签#,一起放在文本下2行
提取文本@谁,放在#标签#下2行

按照格式排序先后:

文本
空行
标签
空行
@谁
  • 写回答

2条回答 默认 最新

  • 码农阿豪@新空间代码工作室 Java领域优质创作者 2024-03-25 18:17
    关注
    让阿豪来帮你解答,本回答参考chatgpt3.5编写提供,如果还有疑问可以评论或留言
    首先,需要将文本竖排清除标点符号。可以使用Python中的正则表达式来实现。 案例代码如下:
    import re
    text = "这是一句含有标点符号的句子,需要清除掉!"
    # 清除标点符号
    clean_text = re.sub(r'[^\w\s]','',text)
    print(clean_text)
    # 输出:这是一句含有标点符号的句子需要清除掉
    

    接着,需要提取#标签#和@谁。同样可以使用正则表达式来实现。 案例代码如下:

    import re
    text = "这是一句含有#标签#和@谁的句子。"
    # 提取#标签#
    tags = re.findall(r'#(\w+)#',text)
    print(tags)
    # 输出:['标签']
    # 提取@谁
    who = re.findall(r'@(\w+)', text)
    print(who)
    # 输出:['谁']
    

    最后,需要重新排版文本,将空行、标签和@谁按照格式排列。 案例代码如下:

    import re
    text = "这是一句含有#标签#和@谁的句子。"
    # 清除标点符号
    clean_text = re.sub(r'[^\w\s]','',text)
    # 提取#标签#
    tags = re.findall(r'#(\w+)#',text)
    # 提取@谁
    who = re.findall(r'@(\w+)', text)
    # 重新排版文本
    new_text = f"{clean_text}\n\n{'#'+tags[0]+'#'}\n\n{'@'+who[0]}"
    print(new_text)
    # 输出:这是一句含有标签和谁的句子
    #         #标签#
    #         @谁
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月3日
  • 已采纳回答 3月26日
  • 修改了问题 3月25日
  • 修改了问题 3月25日
  • 展开全部

悬赏问题

  • ¥20 ic卡dump文件校检码解密
  • ¥15 关于:接收到的数据不是有效的JSON格式
  • ¥15 apdl语言如何增加受力分析
  • ¥15 算法对比:学校优化算法与蚁群算法对比
  • ¥15 机电一体化系统设计说明书
  • ¥20 sgy数据提取地震波速,有人能回答吗小馋
  • ¥20 c#实现打开word的功能,并且需要安装成windows服务,word打不开怎么办
  • ¥15 python用ARIMA时间预测模型预测数据出错,急!
  • ¥30 为什么后端传给前端vue的河流json数据不在地图中显示出来
  • ¥50 关于弹性波动方程求解的问题: