正则表达式或者bs4 匹配得到代码中的汉字部分，不是得到一个，在我程序中需要得到很多个，请大佬帮忙解决一下，谢谢

<a class="topic-text" href="http://tieba.baidu.com/hottopic/browse/hottopic?topic_id=278032&amp;topic_name=%E6%97%A5%E6%9C%AC%E8%A7%84%E5%AE%9A%E5%9D%90%E8%BF%87%E5%B1%B1%E8%BD%A6%E7%A6%81%E6%AD%A2%E5%B0%96%E5%8F%AB" target="_blank">日本规定坐过山车禁止尖叫</a>

日本规定坐过山车禁止尖叫

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
关竹 2020-05-30 11:11
关注
a="""string""" pattern=r'[\u4e00-\u9fa5]+' print(re.findall(pattern,a))

这里\u4e00-\u9fa5是汉字unicode范围

这样有一个问题，举例

<a>日本规定hhhh坐过山车禁止尖叫</a> 匹配返回结果["日本规定","坐过山车禁止尖叫"]

如果你要抓取的内容只在< a>< /a>中间，建议你的正则去匹配">< /a>"中间部分

pattern=r'>(.*)</a>' print(re.findall(pattern,a))

关于字符的unicode范围，你可以看下这篇

https://blog.csdn.net/gatieme/article/details/43235791
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

正则表达式如何分别匹配多个括号中的值 c#
2021-03-03 00:43

回答 1 已采纳 正则表达式：\$\{[^{}]*\} 解释： [abc] 表示字符是 `a` 或者 `b` 或者 `c`[^abc] 表示任意不是 `a` 或者 `b` 或者 `c` 的字符[^{}] 表示任意不
在一个字符串中如何利用正则表达式匹配每隔三个字符都有一个/并且不包括数字 c# 后端有问必答正则表达式
2022-01-14 15:33

回答 1 已采纳 ^([a-z]{3}(\/[a-z]{3})*|\*)$
正则表达式想要匹配数字和中文数字，但是不能同时匹配这两个正则表达式
2022-05-13 13:44

回答 1 已采纳 '一零零一弄'.match(/[\d]+弄|[〇一二三四五六七八九十零壹贰叁肆伍陆柒扒玖拾百千万]+弄/)
python正则表达式开头和结尾摘抄_python正则表达式如何匹配任意文本之后以"结尾...
2021-03-06 15:01

刘嘉耿的博客事情源于我们英语课留了个作业要背单词什么的五百多个词懒得一个个去查了想写个爬虫自动搜索必应词典上的翻译然后我就可以直接看了感觉这个正则表达式的匹配有点难写(对于我来说...)本来想用BeautifulSoup......
如何在Java中使用正则表达式匹配多个内容? java 正则表达式
2017-07-30 01:47

回答 1 已采纳如果传入的只有1行，那只会匹配一个如果传入的是全部文本，需要用 while(m.find()) { }
写一个正则表达式，匹配每3位就有一个逗号的数字 python 正则表达式
2020-08-13 16:09

回答 2 已采纳小括号在正则中有不同的含义一种是指括号内的表达式作为一个整体，也就是你使用的这种，把 `,\d{3}` 作为整体使用 `*` 匹配多个还有一种含义是捕获数据，也就是将括号内表达式匹配到的数据提
正则表达式如何写，在一段字符串中提取指定的内容。 python 正则表达式
2022-05-03 20:38

回答 8 已采纳 import re text = """福建省2022年道路交通事故人身损害赔偿相关数据【福建一般地区（除厦门外）】 1、全省城镇居民人均年可支配收入 51140元2、全省农村居民人均年可支配收
两周从爬虫小白变大神，看完你就知道我不是标题党了【五万字教程，建议收藏】
2021-09-28 09:39

五包辣条！的博客大家好，我是辣条，今天给大家带来最硬核的爬虫教程。目录 Python爬虫第一天什么是爬虫爬虫与Web后端服务之间的关系 Python爬虫技术的相关库常见反爬虫的策略爬虫库urllib【重要】作业爬虫第二天 ...
如何用正则表达式匹配一个单词？正则表达式
2021-12-15 10:33

回答 1 已采纳加上单词边界 \b\bcat\b
正则表达式 匹配正负整数和正负小数或者空有问必答正则表达式
2021-08-25 15:28

回答 6 已采纳已私聊解决
python如何用正则表达式提取一个段落中的其中一句话呢？ html python 正则表达式
2022-03-31 00:35

回答 2 已采纳数字用\d即可
爬虫实战：爬取豆瓣电影 Top-250 到 Excel 表格中
2020-07-28 14:44

_小辉同学_的博客其实本来我是想将数据爬取到excel之后再增加一些数据库操作，然后用flash建立一个网站将数据导入这个网站中…还想着下个模板优化一下网站界面实现数据可视化来着… 但！！！当我万分激动地上号我的pycharm，使用pip...
Php：正则表达式 - 如何提取匹配的多个部分并将其存储在数组中？ php
2017-03-09 15:47

回答 1 已采纳 Split The full String By: /<ul.*?>/m Then iterate over the splits and apply th following
Python程序设计与科学计算精录&总结Episode.4 Python进阶：自动化办公应用（基于Michael导师Python课程与VS2019）
2020-05-20 22:37

笙歌散尽的博客我都低头疾走。宁静的夏，望着猎户天际划破，你许下丝缕的心愿，愿与我恒久。可是，哪里有长守，只不过是慰藉呓语几片。你悄悄地离开，捎去美丽的心愿，敲碎明镜似的梦。待时间的风，寻你脚踪。 ...
大佬总结的前200页Java面试题都在这里了
2018-10-11 11:16

weixin_34146410的博客一个”.java”源文件中是否可以包含多个类（不是内部类）？有什么限制简单说说你了解的类加载器。是否实现过类加载器解释一下什么叫AOP（面向切面编程）请简述 Servlet 的生命周期及其...
没有解决我的问题, 去提问

悬赏问题

¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料

正则表达式或者bs4 匹配 得到 代码中的汉字部分，不是得到一个，在我程序中需要得到很多个，请大佬帮忙解决一下，谢谢

1条回答

悬赏问题

正则表达式或者bs4 匹配得到代码中的汉字部分，不是得到一个，在我程序中需要得到很多个，请大佬帮忙解决一下，谢谢