文本处理，文本竖排清除标点符号，提取#标签#，和@谁，重新排版

文本处理，文本竖排清除标点符号，提取#标签#，和@谁，重新排版

这段文字是一位网络内容创作者在谈论自己的创作经历和挑战。他觉得创作很困难，因为他不知道写什么，也没有收入。他觉得自己没有擅长的领域，也没有学到什么写作技巧。他看到了一篇文章，建议创作者写自己喜欢的东西，但他还是觉得很难找到可写的内容。他认识到网络创作不容易赚钱，需要有技能或坚持下去。他认为坚持是成功的关键，无论是迅速走红还是慢慢积累粉丝。
#头条生活感受# 让我想起疫情期间成都三环边上两人戴口罩吵架，然后相互查了健康码、才摘下口罩互骂。[捂脸]#成人才懂的事# @今日头条青云计划


清理标点符号变成换行
>1行空行的空行=1个空行
提取文本#标签#，一起放在文本下2行
提取文本@谁，放在#标签#下2行

按照格式排序先后：

文本
空行
标签
空行
@谁

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间新星创作者: 前端开发技术领域 2024-03-25 18:17
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
首先，需要将文本竖排清除标点符号。可以使用Python中的正则表达式来实现。案例代码如下：
import re text = "这是一句含有标点符号的句子，需要清除掉！" # 清除标点符号 clean_text = re.sub(r'[^\w\s]','',text) print(clean_text) # 输出：这是一句含有标点符号的句子需要清除掉

接着，需要提取#标签#和@谁。同样可以使用正则表达式来实现。案例代码如下：

import re text = "这是一句含有#标签#和@谁的句子。" # 提取#标签# tags = re.findall(r'#(\w+)#',text) print(tags) # 输出：['标签'] # 提取@谁 who = re.findall(r'@(\w+)', text) print(who) # 输出：['谁']

最后，需要重新排版文本，将空行、标签和@谁按照格式排列。案例代码如下：

import re text = "这是一句含有#标签#和@谁的句子。" # 清除标点符号 clean_text = re.sub(r'[^\w\s]','',text) # 提取#标签# tags = re.findall(r'#(\w+)#',text) # 提取@谁 who = re.findall(r'@(\w+)', text) # 重新排版文本 new_text = f"{clean_text}\n\n{'#'+tags[0]+'#'}\n\n{'@'+who[0]}" print(new_text) # 输出：这是一句含有标签和谁的句子 # #标签# # @谁
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

5个必试的DeepSeek-OCR功能：10块钱全体验
2026-01-18 02:36

IronwoodStag78的博客本文介绍了如何在星图GPU平台自动化部署DeepSeek-OCR-WEBUI...该平台支持一键启动GPU实例，快速运行模型，适用于PDF转Markdown、手写体识别、表格还原等典型场景，尤其适合需要私有化部署AI应用的技术爱好者和开发者。
零基础玩转PDF-Extract-Kit-1.0：小白也能快速上手的云端GPU方案
2026-01-15 07:54

SilvermistOwl67的博客本文介绍了基于星图GPU平台自动化部署PDF-Extract-Kit-1.0镜像的完整方案，帮助零基础用户快速实现复杂版式文档的智能提取。该镜像支持古籍、公式、表格等高难度内容识别，典型应用于将扫描版古籍PDF高效转换为结构...
快速验证OCR文字识别技术：云端GPU环境下的实战演练
2026-01-19 07:06

SilvermistRaven28的博客查看图片是否过大（建议控制在5MB以内）检查图片格式是否受支持（避免WebP、HEIC等冷门格式）重启实例，清除缓存问题3：识别结果乱码或全是符号确保文本为中文或常用语言检查是否误用了英文模型尝试重新上传，...
51c大模型~合集181
2025-09-12 19:40

whaosoft-143的博客它不再是被动地接收和处理信息，而是像一个侦探一样，主动思考、调用工具、并根据线索进行推理，尤其是通过“先听后看”的策略，实现了前所未有的细粒度音视频理解。论文标题: OmniAgent: Audio-Guided Active ...
专升本信息技术
2022-04-24 20:28

徐州城的博客具体案例：雷达、卫星遥感等感测与识别技术使人们的感知范围、感知精度和灵敏度大为提高：电话、电视、因特网(Internet)等通信技术与光、电、磁等信息存储技术几乎消除了人们交流信息的空间和时间障碍；计算机、...
word技巧
2018-03-01 21:40

erpmath的博客 29 19、添加常用中文标点和其它符号工具栏... 30 20、在Word中进行繁简体文本转换... 30 21、在屏幕提示中显示快捷键... 30 22、使用格式刷复制格式... 30 23、使用格式刷重复复制格式... 31 24、只对Word文档的一...
【转】word 高效经典教程
2011-10-03 17:03

Gambler的博客 A、基础知识... 6 1、度量单位... 6 2、WORD中文字字号与磅的对应关系...... 3、字体文件格式......B、文本编辑... 7 1、快速移动文档... 7 2、快速传递文档... 8 3、删除空行... 8 4、多处剪切，一处粘贴... 8
Word XP 中目录的编制方法,Word XP 功能键使用大全
2008-05-03 09:57

citywalker007的博客指向"插入"菜单上的"引用"，再单击"索引和目录"。　3.单击"目录"选项卡。　4.若要使用现有的设计，请在"格式"框中单击进行选择。　5.根据需要，选择其他与目录有关的选项。　如果目前未使用大纲级别或内置样式，请...
天若OCR文字识别工具——高效截图转可编辑文本的智能解决方案
2025-10-27 23:53

不吃酸菜的小贱人的博客主界面采用三栏式设计：| 工具栏 | || [截图] ...|各模块功能如下：工具栏：集中常用操作按钮预览区：展示待识别图像，支持缩放与平移语言选择：切换当前OCR识别语种结果编辑区：输出识别结果，支持富文本格式粘贴。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月25日
展开全部

文本处理，文本竖排清除标点符号，提取#标签#，和@谁，重新排版

2条回答 默认 最新

问题事件

2条回答默认最新