如何用正则表达式筛选出评论里的用户名，并将其替换成字符串"Username"

爬油管评论，做语义分析，评论中有@别人进行回复。但是这些用户名对语义分析没有用处。如何将他们用正则表达式筛选出来，然后替换成字符串“Username“

1.第一种情况回复是有@打头的

@Yu Yu 你只是一个游客，人家本身的生活习惯使5使為你改变

@Chen Vergil 人地只懂北上返大陆唔懂北角在哪里哈哈哈

@梁侃另，我们广东人认为广东以北都系北方

2.有的情况是：没有@字符，只有对方用户名，但大多这种情况，是英文的用户名：

Chiu Alice 怎么可以这样

Su Chung 香港街头乱七八糟

如何匹配？筛选出来，然后用“Username”替换掉

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
JonathanYTR 2019-12-12 22:01
关注
你这个没法确定分出来的部分是否是完整的用户名吧，你的例子里@Yu Yu中间是包含空格的，中英文也都有，所以有可能把后面的正文也识别进来。
想确定得到的部分是不是用户名只能去用户数据库查有无这个用户名，而且这是不可能的，所以我觉得你没必要这么做。
具体怎么改善就得看你除了这个要求还有什么次要的要求了，我的想法是分出用户名后去爬一下主页，爬到了就按用户名处理并记录，但是没有at符号的就没办法了，只能看之前的记录里有没有存了。而且没有at符号的很难判断，比如“那个广东人是广东人”这句话里，你没法判断哪个广东人是用户名，那个是地区名，其他情况类似，所以针对处理第一种情况就好。
或者你看下用户名标识中间的空格是不是空格，还是特殊字符，因为网页肯定也要区分的，应该会有对应的标记，没有就没辙了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

Python使用正则表达式分割字符串的实现方法
2020-12-26 05:11

pattern：表示模式字符串，由要匹配的正则表达式转换而来。 string：表示要匹配的字符串。 maxsplit：可选参数，表示最大的拆分次数。 flags：可选参数表示标志位，用于控制匹配方式，如是否区分子母大小写示例代码...
Python字符串验证与正则表达式
2024-01-14 12:54

一键难忘的博客在本文中，我们将深入探讨Python中多种方法，用于检查字符串是否只由字母组成，并且将关注这些方法的应用场景以及它们的优缺点。在实际应用中，可能会遇到更多的场景，需要验证字符串的其他属性。在实际应用中，可能...
python使用正则表达式匹配字符串开头并打印示例
2020-12-25 13:05

本文实例讲述了python使用正则表达式匹配字符串开头并打印的方法。分享给大家供大家参考，具体如下： import re s="name=z1hangshan username=fff url=www.baidu.com password=ddd256" s2="username=fff name=z1...
Python程序设计：正则表达式检索与替换.pptx
2022-06-13 17:46

4. 分割（Split）：`re.split()`函数根据正则表达式将字符串分割成多个子串。具体函数的使用方法： - `re.match(pattern, string)`：仅检查字符串的开头是否匹配，若不匹配则返回None。 - `re.search(pattern, ...
【Python基础】字符串 & 正则表达式
2021-06-29 18:47

L Jiawen的博客 Python 字符串支持三种定义方式，属于不可变序列，支持双向索引取出字符、切片操作（无法赋值）。
Python字符串及正则表达式（十一）：正则表达式、使用re模块实现正则表达式操作
2024-12-21 15:16

Linux运维技术栈的博客 正则表达式，作为处理字符串的强大工具，以其灵活的模式匹配能力，在文本搜索、数据清洗、格式验证等领域发挥着不可替代的作用。本系列博客已经带领大家逐步深入了 Python 字符串操作的多个方面，从基础的字符串操作...
python 正则表达式生成字符串_python使用正则表达式匹配字符串开头并打印示例...
2021-01-13 06:06

电商Z先生的博客本文实例讲述了python使用正则表达式匹配字符串开头并打印的方法。分享给大家供大家参考，具体如下：import res="name=z1hangshan username=fff url=...
Python进阶(二)：Python正则表达式和字符串
2022-11-25 10:01

桃酥zz的博客那么正则表达式一定是一个非常好的助手，因为它可以帮助我们迅速的从网页代码中发现某种我们指定的模式并提取出我们需要的信息，当然对于初学者来收，要编写一个正确的适当的正则表达式可能并不是一件容易的事情...
使用正则表达式分割字符串
2024-05-30 22:28

橙子味冰可乐的博客 split()方法用于实现根据正则表达式分割字符串，并以列表的形式返回。其作用同字符串对象的split()方法类似，所不同的就是分割字符由模式字符串指定。场景模拟：微博的@好友栏目中，输入“@ @扎克伯格 @俞敏洪”...
别再手动处理字符串！Python 正则表达式实战手册（入门到精通）
2025-08-19 20:51

dlraba802的博客使用原始字符串（r''）避免转义问题复杂正则表达式可添加注释x).预编译常用模式.分组提取正则表达式虽然学习曲线陡峭，但掌握后能极大提高文本处理效率。建议从简单模式开始练习，逐步构建复杂表达式。
没有解决我的问题, 去提问

如何用正则表达式筛选出评论里的用户名，并将其替换成字符串"Username"

4条回答 默认 最新

4条回答默认最新