请问用BeautifulSoup如何获取p标签内的值

从网上爬下来了一道数学题，不知道该怎样获取里面的值了

 soup = BeautifulSoup(problem_content, 'html.parser')  # 这个problem_content是个从网上爬下来的数学题，里面包含很多的HTML标签        
        # print soup  # 全部是乱码，网上找资料说是没有\xa0这个编码
        # print soup.prettify().replace(u'\xa0', '')  # 安装文档形式输出,正常输出
        # print soup.p  # 输出的p标签内容全部是乱码
        # print soup.encode('gb18030')  # 除中文外全部是 乱码        
        new_soup = soup.prettify().replace(u'\xa0', '')  # new_soup为unicode格式
        s_soup = BeautifulSoup(new_soup, 'html.parser')  # 再次将其转为bs4格式数据
        cont = s_soup.p.encode('gb18030')   # print type(cont)返回 <type 'str'>
        # print type(new_soup)  返回 <type 'unicode'>             
        print cont

print cont返回值是：

 <p>
 如图所示，圆锥 $SO$ 的轴截面 $△$$SAB$ 是边长为$ 4 $的正三角形，$M$为母线 $SB$的中点，过直线 $AM$ 作平面 $β$ $⊥$ 面 $SAB$ ，设 $β$
 <span>
  与圆锥侧面的交线为椭圆 $C$，则椭圆 $C$ 的短半轴
 </span>
 <span style="font-size:12px;line-height:1.5;">
  为(  )
 </span>
</p>

由于这个cont是个str类型的值，请问老师我该如何才能回去这个值

标签内部的值？用cont.string返回错误提示：cont没有string属性

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2015-10-11 15:55
关注
http://zhidao.baidu.com/link?url=RwqRI-mffUi0v72naV59GVaAyDeFVECc6vtfaE82hwVWumkAUNGCSTGHi-et-WADdNO7x5t5VnflbTxKsBtElbMqf2i4UhTfM3uJZoOAo0e

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问用BeautifulSoup如何获取p标签内的值 python 爬虫
2015-10-11 14:32

回答 1 已采纳 http://zhidao.baidu.com/link?url=RwqRI-mffUi0v72naV59GVaAyDeFVECc6vtfaE82hwVWumkAUNGCSTGHi-et-WADdNO
python爬虫bs4中用select如何获取属性值 python
2021-12-26 12:33

回答 2 已采纳 ```python from bs4 import BeautifulSoup import re html = """ <html><head><title>
beautifulsoup如何提取HTML文件中两个相同标签之间的文本？ python 爬虫
2022-07-28 20:30

回答 3 已采纳建议还是使用正则表达式提取会节省内存，主要是由于文件过大，如果使用lxml、bs，会构建完整的数据结构，就会造成内存不足。假设文件是data.html，使用compile对象和re.finditer能
Python爬虫入门8：BeautifulSoup获取html标签相关属性
2021-01-30 10:17

LaoYuanPython的博客本节介绍了BeautifulSoup对象的主要属性，通过这些属性可以访问特定标签和内容。
Python爬虫 BeautifulSoup解析网页爬取内容为None python 有问必答
2021-08-31 14:07

回答 2 已采纳你抓的频率太快，IP被墙了
python爬虫如何取出定位标签下的所有子集文本 python
2021-03-27 16:46

回答 1 已采纳将原代码中这段内容： for j in page_spec_data: for k in j.a: # print(k.string) value_word
为啥我取不到p标签的数据？ python
2021-09-30 13:34

回答 1 已采纳 temp = html.find_all("div", class_="col-lg-4")首先一个页面含有多个div，并不是每个div里面都会含有p标签你要判断啊，不能默认肯定能找到p标签
python 3利用BeautifulSoup抓取div标签的方法示例
2020-12-24 09:56

本文主要介绍的是关于python 3用BeautifulSoup抓取div标签的方法示例，分享出来供大家参考学习，下面来看看详细的介绍：示例代码： # -*- coding:utf-8 -*- #python 2.7 #XiaoDeng #...
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
Python爬虫这里的第一个<i>标签为什么用Find_all查找不到，自动跳过了啊 python 有问必答爬虫
2021-09-17 21:21

回答 2 已采纳第一个i是dd的子元素，遍历的时候tag就包含i。i再找i，html结构中并没有i嵌入i的结构，所以无法找到。直接获取dd节点find_all下面的i节点就行有帮助麻烦点个采纳【本回答右上角】，谢谢~
【python】利用BeautifulSoup提取html中的标签、数据
2022-08-29 23:02

zhangbin_237的博客对于不熟悉HTML和正则表达式的人，可以用第三方模块包BeautifulSoup来提取HTML或XML中的数据。
Python爬虫过程中,fina_all没有内容，标签是正常的，求助 python
2020-12-09 17:45

回答 1 已采纳 follow_inner 标签可能有多个，而第一个是空的，试试findall吧。实在不行就使用xpath提取，简单方便。
python中beautifulsoup怎么输出文本内容,python-使用BeautifulSoup获取标签内的所有内容...
2021-04-27 00:59

Outtttta的博客但是,使用时print soup.article它只会一直延伸到“ …艺术与Weise和fürverschiedene Zwecke bearbeiten”.完整代码：from bs4 import BeautifulSoupimport requestsrequest_page = requests.get('...
python获取标签属性值_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释
2020-12-16 17:55

weixin_39881802的博客更多python教程请到：菜鸟教程www.piaodoo.com人人影视www.sfkyty.com16影视www.591319.com星辰影院www.591319.com一、Tag(标签)对象1.Tag对象与XML或HTML原生文档中的tag相同。from bs4 import BeautifulSoupsoup ...
没有解决我的问题, 去提问

悬赏问题

¥15 Excel发现不可读取的内容
¥15 UE5#if WITH_EDITOR导致打包的功能不可用
¥15 关于#stm32#的问题：CANOpen的PDO同步传输问题
¥20 yolov5自定义Prune报错，如何解决？
¥15 电磁场的matlab仿真
¥15 mars2d在vue3中的引入问题
¥50 h5唤醒支付宝并跳转至向小荷包转账界面
¥15 算法题：数的划分，用记忆化DFS做WA求调
¥15 chatglm-6b应用到django项目中，模型加载失败
¥15 CreateBitmapFromWicBitmap内存释放问题。

请问用BeautifulSoup如何获取p标签内的值

1条回答 默认 最新

悬赏问题

1条回答默认最新