Python 如何提取列表里面的文字？

我用Python 爬取一个网站用正则提取的但是提取后输出的是一个列表而且有很多源代码里面的文字比如</a></h3><div class="c-row c-gap-top-small"><div class="general_image_pic这种的想过修改正则但是花了好久的时间都没有比这个更好的正则因为网站是不规则的只有这一个规律（目前找到的）哪位大神能回答一下？有什么方法？

我的想法是我用现在的正则爬取出来内容因为输出的事列表然后再从列表里面提取出文字然后就可以导入MySQL

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
考古学家lx(李玺) python领域优质创作者 2020-11-27 16:12
关注
列表遍历下，把html标签去了就行了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

怎么提取里面的文字？ python 有问必答
2021-06-21 17:57

回答 6 已采纳用正则表达式取出字符串中{。。。。。。。。。}的内容，再用json.loads()转成字典，就可以按照字典对象的方式提取字典中的键值了例子 import re import json s
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
Python获取div下内容 python 爬虫
2022-04-14 10:52

回答 1 已采纳一个取巧的方法： # span后面的懒得写了。。正则表达式的前后缀你可以改动一下 list_match = re.findall(r'<span...>(.*?)</span>
如何使用Python从图片中提取文字？
2022-11-24 15:41

Coinmach的博客目录 Python图片识别文字一、Tesseract下载及安装二、配置环境变量三、代码部分 Python图片识别文字一、Tesseract下载及安装下载链接 Index of /tesseract. 点击下载适合电脑配置的最新版本下载完成并开始安装...
python 在excel 中的单元格提取出数字 python
2023-02-16 15:51

回答 12 已采纳你可以使用Python中的正则表达式（regex）来提取单元格中的数字，以下是一个示例代码，其中使用了re.findall方法来查找数字，并返回一个列表，列表的长度即为单元格中数字的数量： impor
如何提取这个iso文件里面的文字？neixiang c++ c语言 html5 java python
2019-05-10 13:18

回答 2 已采纳设置错误悬赏金额了，我重新发一贴
python 里面 excel 有以下单元格的数据,如何实现以下代码 python
2023-02-16 15:46

回答 10 已采纳你好，根据您的需求，代码如下，请采纳： import pandas as pd import re df = pd.read_excel('A.xls',encoding='utf8') for
python音频文件转文字.zip
2021-05-16 14:39

调用讯飞开放平台的接口实现语音转写，运行代码将音频文件自动转为txt文本。里面有详细的使用说明，新用户最多可领取500小时的免费时长。
如何提取这个iso文件里面的文字？内详 c++ c语言 html5 java python
2019-05-10 13:24

回答 5 已采纳文字嵌入到图片中的没搞，只能orc识别。字幕制作参考 https://zhuanlan.zhihu.com/p/26634531 https://miao.wondershare.cn/a
用Python做一个word转Excel python
2022-06-15 08:44

回答 1 已采纳只能给你提供一个大概的思路：首先使用docx模块的Document模块打开word文件获取其中相关的信息，而后可以使用正则表达式来处理对应信息，最后就是写入excel表格，这个模块比较多，建议使用py
python 运行这段代码进入循环后退出 python 有问必答
2022-03-12 10:37

回答 3 已采纳你的意思是函数执行后没有打印输出还是?TranslateFile函数需要读取.\dst_dir目录下的文件读取,读取的PDF类文件,你的目录下放置文件了吗,还是路径不对
python代码提取图片文字
2022-10-09 22:09

祈愿lucky的博客 python代码提取图片文字
python正则匹配，为什么匹配不到文本的后半部分？ python
2020-12-10 17:05

回答 1 已采纳 print(re.match('.*',data).group())
Python实现图片中文字提取（OCR）
2020-12-22 13:29

用Python提取图片中的文字，用到的工具包有PIL,pytesseract,tesseract-ocr 注意：库的安装相对麻烦一点,一般都是不能直接安装成功的，这里总结了安装过程中的一些坑给大家参考。（1）首先是PIL库安装，有的电脑...
python提取pdf文字_python 提取pdf文字
2020-12-04 02:27

weixin_39654245的博客 LTTextBoxHorizontal from pdfminer.pdfinterp import PDFTextExtractionNotAllowed, PDFResourceManager, PDFPageInterpreter def pdfParse(path): """ pdf文字提取 :param path:文件路径 :return: 每页结果列表 ...
没有解决我的问题, 去提问

悬赏问题

¥15 求帮我调试一下freefem代码
¥15 matlab代码解决，怎么运行
¥15 R语言Rstudio突然无法启动
¥15 关于#matlab#的问题：提取2个图像的变量作为另外一个图像像元的移动量，计算新的位置创建新的图像并提取第二个图像的变量到新的图像
¥15 改算法，照着压缩包里边，参考其他代码封装的格式写到main函数里
¥15 用windows做服务的同志有吗
¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？

Python 如何提取列表里面的文字？

1条回答 默认 最新

悬赏问题

1条回答默认最新