求一个正则表达式,提取utf8编码的字符串中的汉字,剔除英文、数字、特殊符号等
[b]问题补充:[/b]
多谢,
目前需要ruby程序
求一个正则表达式,提取utf8编码的字符串中的汉字,剔除英文、数字、特殊符号等
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
14条回答
- iteye_10288 2009-04-16 23:22关注
楼上的太复杂了。
我不知道正则怎么写
不过自己写了个很简单的:[code="ruby"]
def find_chinese_charactor str
str.unpack("U*").select{ |p| (0x4e00..0x9fa5).member? p }.pack("U*")
end#测试用例
"今天开始下雨了,it start to rain,now.123123哈哈".unpack("U*").select{ |p| (0x4e00..0x9fa5).member? p }.pack("U*")#output copied to clipboard
#今天开始下雨了哈哈
[/code]再比我简单的估计只有用正则了吧
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
- ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
- ¥20 有关区间dp的问题求解
- ¥15 多电路系统共用电源的串扰问题
- ¥15 slam rangenet++配置
- ¥15 有没有研究水声通信方面的帮我改俩matlab代码
- ¥15 ubuntu子系统密码忘记
- ¥15 保护模式-系统加载-段寄存器
- ¥15 电脑桌面设定一个区域禁止鼠标操作
- ¥15 求NPF226060磁芯的详细资料