python爬虫返回的是<Element div at 0x2751c6ecc80>


# coding=utf-8
# noinspection PyUnresolvedReferences
import parsel
import requests
# noinspection PyUnresolvedReferences
import re
from lxml import etree

url = 'https://zhidao.baidu.com/question/2207469534762529468.html'

headers = {
    'Cookie':'OCSSID=4df0bjva6j7ejussu8al3eqo03',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
                 ' (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
}
response = requests.get(url)
xml = response.content
data = etree.HTML(xml).xpath('//*[@accuse="aContent"]')
print(data)

获取到的内容是这样的如何才能获取到需要的内容

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
renminzdb 2021-07-22 22:27
关注
你这个打印的不对，你打印的是 DOM 节点的对象，你应该取这个div的text() 或者 html() 内容才对。

print(data.text) 试一试

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

爬虫报错Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x000002B5F5BC3C10> json python 爬虫
2022-02-25 14:06

回答 1 已采纳感觉是网址问题，所以报ConnectionError，这网址我浏览器上不去
python爬虫返回的html文件打开网页是空的 python
2022-06-15 23:07

回答 1 已采纳很正常，一个网页能运行，不但需要html文件，还需要css和js文件在背后支撑。（前端和后端）你只是爬下来了一个html文件，自然什么都不会展示出来。你仔细想想，如果这么轻易的就能被你爬到百度的htm
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python使用xpath中遇到：<Element a at 0x39a9a80>到底是什么？
2020-09-20 22:36

首先，`<Element a at 0x39a9a80>`并不是一个字符串，而是一个对象的表示，具体来说，它是`lxml.etree._Element`类的一个实例。在Python中，`0x39a9a80`是内存地址，用于标识对象在内存中的位置。这种表示方式表明...
Python获取div下内容 python 爬虫
2022-04-14 10:52

回答 1 已采纳一个取巧的方法： # span后面的懒得写了。。正则表达式的前后缀你可以改动一下 list_match = re.findall(r'<span...>(.*?)</span>
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
python爬虫时Status code是500怎么解 python
2021-07-20 18:50

回答 4 已采纳在传递json格式数据时（content-type: application/json），使用json参数 import requests headers = { "Content-Type
讲讲python使用xpath中遇到[<Element a at 0x39a9a80>到底是什么
2017-12-30 01:57

lyuharvey的博客写在前面本人的所有文章只适合善于使用百度的人，因为所有基础知识个个博客复制粘贴了无数遍，我这里均不会详细讲述。在这里我表示所有不经...大家在学习python爬虫的过程中，会发现一个问题，语法我看完了，说...
python的requests爬虫返回了与原网页内容不符的javascript，如何解决？ python
2021-03-29 11:19

回答 3 已采纳异步加载的问题, 可以使用selenium 工具包进行爬取, 可参考: import pandas as pd import numpy as np import time from seleni
python 爬虫 post请求返回的数据不全，和postman模拟的不一样，关键内容是个空列表 python 有问必答爬虫
2021-09-08 11:50

回答 2 已采纳经过实际测试，该站对 refer和 origin 没有验证，却验证了 content-type，你在header里加上content-type就可以了 import requests impor
python爬虫问一下咋样吧返回的None去掉 python 有问必答
2021-08-02 15:47

回答 2 已采纳返回的数据中有None值，说明按正则获取的节点中有的就无图片链接。你可以在语句中加入 if else 去剔除掉None值。
python中filter函数输出时出现＜filter object at 0x000001A92B1C3188＞问题
2020-10-10 18:22

联想还行把的博客项目场景：问题描述：没有过滤出列表中的奇数原因分析： filter()函数输出后是一个数组而不是列表， print(new_list)中的new_list是在以列表形式的情况下可以输出解决方案：共有两种解决方案： ...
爬虫手册01 XPath的使用
2022-02-10 00:10

一个小黑酱的博客下面代码用到的test.html <div> <ul> <li class="item-0"><a href="link1.html">first itema>li> <li class="item-1"><a href="link2.html">second itema>li> <li class="item-inactive"><a href="link3.html">...
python语言map函数及map object at 乱码错误
2020-05-07 19:30

瑾疏的博客文章目录一、map函数的简介 1、map函数的作用 2、语法格式 3、举例例1、例2、二、报错一、map函数的简介 1、...这是因为python3中map()返回iterators类型，不再是python2中的list类型。对此我们进行list转换即可。
分享Python7个爬虫小案例（附源码）
2022-10-22 07:00

艾派森的博客本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点，非常适合刚入门python爬虫的小伙伴参考学习。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月22日

悬赏问题

¥15 QTOF MSE数据分析
¥15 平板录音机录音问题解决
¥15 请问维特智能的安卓APP在手机上存储传感器数据后，如何找到它的存储路径?
¥15 (SQL语句|查询结果翻了4倍)
¥15 Odoo17操作下面代码的模块时出现没有'读取'来访问
¥50 .net core 并发调用接口问题
¥15 网上各种方法试过了，pip还是无法使用
¥15 用verilog实现tanh函数和softplus函数
¥15 Hadoop集群部署启动Hadoop时碰到问题
¥15 求京东批量付款能替代天诚

python爬虫返回的是<Element div at 0x2751c6ecc80>

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新