问题遇到的现象和发生背景
做一个深度学习的数据处理,在xlsl数据中,包括大量的中文、英文、日文等语言的评论,每一条评论占用一行
希望通过筛选只留下中文评论
我的解答思路和尝试过的方法
使用正则表达式匹配含有日文、英文的段落,但是有些中文文字里也有英文,不能直接去除。
我想要达到的结果
希望通过筛选只留下中文评论,使用日语、英语的评论直接删除
做一个深度学习的数据处理,在xlsl数据中,包括大量的中文、英文、日文等语言的评论,每一条评论占用一行
希望通过筛选只留下中文评论
使用正则表达式匹配含有日文、英文的段落,但是有些中文文字里也有英文,不能直接去除。
希望通过筛选只留下中文评论,使用日语、英语的评论直接删除