luoluo20000504 2009-04-16 16:02
浏览 512
已采纳

求一个正则表达式,提取utf8编码的字符串中的汉字,剔除英文、数字、特殊符号等

求一个正则表达式,提取utf8编码的字符串中的汉字,剔除英文、数字、特殊符号等
[b]问题补充:[/b]
多谢,
目前需要ruby程序

  • 写回答

14条回答

  • iteye_10288 2009-04-16 23:22
    关注

    楼上的太复杂了。
    我不知道正则怎么写
    不过自己写了个很简单的:

    [code="ruby"]
    def find_chinese_charactor str
    str.unpack("U*").select{ |p| (0x4e00..0x9fa5).member? p }.pack("U*")
    end

    #测试用例
    "今天开始下雨了,it start to rain,now.123123哈哈".unpack("U*").select{ |p| (0x4e00..0x9fa5).member? p }.pack("U*")

    #output copied to clipboard
    #今天开始下雨了哈哈
    [/code]

    再比我简单的估计只有用正则了吧

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(13条)

报告相同问题?

悬赏问题

  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料