2 jyc 5675587596 jyc_5675587596 于 2017.09.15 14:46 提问

python中用正则表达式去掉除汉字以外的所有字符

因为我是刚学!有可能问题很智障·大家谅解!

print(title)
[

国内新闻_新闻中心_新浪网]

怎么才能只取到文字部分!谢谢!

1个回答

oyljerry
oyljerry   Ds   Rxr 2017.09.15 15:49
 import re

sample = u'I am from 美国。We should be friends. 朋友。'
for n in re.findall(ur'[\u4e00-\u9fff]+',sample):
    print n
Csdn user default icon
上传中...
上传图片
插入图片