关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
m0_63280638
2021-12-16 23:12
采纳率: 50%
浏览 28
首页
Python
已结题
问下python爬取到的文本有中英文对照怎么去除中文段落
python
如题,已经去掉中文了,但中文段落里的数字和英文符号还有括号删不掉
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
1
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
陈年椰子
2021-12-16 23:30
关注
不能全文直接识别中文字符然后去掉。
要先分段,把包含中文字符的整段去掉。
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
1
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(0条)
向“C知道”追问
报告相同问题?
提交
关注问题
Python
3速查表
中英文
PDF版最新版本
2024-12-13 20:54
以下是对您提供的
段落
...这套速查卡提供
中英文
PDF版本,适合需要快速查阅
Python
基础知识的朋友。感兴趣的用户可以下载并尝试使用,以辅助学习和实践。 希望这种组织方式能够更清晰地传达信息。如果您有任何其他需求或
python
爬虫实战——小说
爬取
2023-05-21 21:01
清清清清弦的博客
基于requests库和lxml库编写的爬虫,目标小说网站域名http://www.365kk.cc/,类似的小说网站殊途同归,均可采用本文方法
爬取
。
python
文本
处理 保留
中英文
和标点符号_
python
-
文本
处理和正则表达式
2020-12-03 21:39
weixin_39692253的博客
其中也用到了
python
中的正则表达式部分re,后来就想能不能将我遇到的这类问题全部用正则去解决,具体就是
python
的re模块。答案目前还不知道,在还没遇到更多的问题之前,还是不要轻易下结论。这篇文章就当作一个备忘...
现在有分段、句子数量可能不一致的
中英文
文本
,如何用
python
实现
中英文
对照
翻译(即每行英文对应相应的
中文
)
2025-03-15 22:52
dev.null的博客
以下是处理分段且
中英文
句子数量可能不一致的
文本
的
Python
实现方案,包含分句、翻译和对齐功能: 功能特点: 智能分句处理:
段落
保持功能:容错对齐机制: 批量翻译优化: 输出示例: 使用说明: 安装依赖...
Python
中文
文本
分析(期末大作业).rar
2021-08-05 16:13
Python
中的`wordcloud`库可以方便地创建词云图,通过调整字体、颜色和形状等参数,使得
文本
中的高频词汇以视觉化的方式呈现出来。 3. **主要人物出场次序**:在分析文学作品时,追踪人物出场次序是理解故事结构的...
python
去掉
中文
或英文
2020-08-21 14:30
nie303671298的博客
def find_chinese(file): pattern = re.compile(r'[^\u4e00-\u9fa5]') chinese = re.sub(pattern, '', file) print(chinese) def find_english(file): pattern = re.compile(r'[\u4e00-\u9fa5]') ...
【
Python
网络爬虫案例】
python
爬虫之
爬取
豆瓣电影信息
2024-08-04 17:55
左手の明天的博客
运行环境:
PYTHON
撰写作者:左手の明天 精选专栏:《
python
》 推荐...# 根据标题数量,设置
中文
名和外文名 if len(title) == 2: info_03 = title[0] #
中文
名 info_04 = title[1].replace('/', '') # 英文名,
去除
斜杠...
【小沐学NLP】
Python
实现
中文
、英文分词
2022-09-24 14:00
爱看书的小沐的博客
机器学习之所以看上去可以解决很多复杂的问题,是因为它把这些问题都转化为了数学问题。...分词就是将句子、
段落
、文章这种长
文本
,分解为以字词为单位的数据结构,方便后续的处理分析工作。(1)
中文
分词⼯具
textwrap库:
Python
格式化
文本
段落
2021-04-07 18:16
李元静的博客
目录前言切割文档
文本
缩进
文本
去缩进截断
文本
...一般来说,一篇英文文档在不考虑换行的情况下,默认是填充整个文档行才切换至下一行的。现在,我们需要保证每行必须有且仅有50个字符怎么办? 我们
python
中英文
字符和
中文
字符存储长度不同_
python
中ljust填充包含
中英文
字符串问题...
2021-01-12 15:57
望止洋的博客
但ljust在填充包含
中英文
字符串的时候,填充后的长度总是不对,导致输出无法真正对齐,其根本原因在于ljust中可能使用了len统计字符个数,而英文一般只占位1个字符,
中文
是要占位2个字符的,但len是不分
中英文
的,...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
系统已结题
12月25日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
已采纳回答
12月17日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
12月16日