luoluo20000504 2009-04-16 16:02
浏览 512
已采纳

求一个正则表达式,提取utf8编码的字符串中的汉字,剔除英文、数字、特殊符号等

求一个正则表达式,提取utf8编码的字符串中的汉字,剔除英文、数字、特殊符号等
[b]问题补充:[/b]
多谢,
目前需要ruby程序

  • 写回答

14条回答 默认 最新

  • iteye_10288 2009-04-16 23:22
    关注

    楼上的太复杂了。
    我不知道正则怎么写
    不过自己写了个很简单的:

    [code="ruby"]
    def find_chinese_charactor str
    str.unpack("U*").select{ |p| (0x4e00..0x9fa5).member? p }.pack("U*")
    end

    #测试用例
    "今天开始下雨了,it start to rain,now.123123哈哈".unpack("U*").select{ |p| (0x4e00..0x9fa5).member? p }.pack("U*")

    #output copied to clipboard
    #今天开始下雨了哈哈
    [/code]

    再比我简单的估计只有用正则了吧

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(13条)

报告相同问题?

悬赏问题

  • ¥15 Matlab问题解答有两个问题
  • ¥50 Oracle Kubernetes服务器集群主节点无法访问,工作节点可以访问
  • ¥15 LCD12864中文显示
  • ¥15 在使用CH341SER.EXE时不小心把所有驱动文件删除了怎么解决
  • ¥15 gsoap生成onvif框架
  • ¥15 有关sql server business intellige安装,包括SSDT、SSMS。
  • ¥15 stm32的can接口不能收发数据
  • ¥15 目标检测算法移植到arm开发板
  • ¥15 利用JD51设计温度报警系统
  • ¥15 快手联盟怎么快速的跑出建立模型