qq_42985838 2021-07-22 20:38 采纳率: 92.4%
浏览 671
已结题

python爬虫返回的是<Element div at 0x2751c6ecc80>


# coding=utf-8
# noinspection PyUnresolvedReferences
import parsel
import requests
# noinspection PyUnresolvedReferences
import re
from lxml import etree

url = 'https://zhidao.baidu.com/question/2207469534762529468.html'

headers = {
    'Cookie':'OCSSID=4df0bjva6j7ejussu8al3eqo03',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
                 ' (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
}
response = requests.get(url)
xml = response.content
data = etree.HTML(xml).xpath('//*[@accuse="aContent"]')
print(data)

img
获取到的内容是这样的如何才能获取到需要的内容

  • 写回答

4条回答 默认 最新

  • renminzdb 2021-07-22 22:27
    关注

    你这个打印的不对,你打印的是 DOM 节点的对象,你应该取这个div的text() 或者 html() 内容才对。

    print(data.text) 试一试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 10月30日
  • 已采纳回答 10月22日
  • 创建了问题 7月22日

悬赏问题

  • ¥15 QTOF MSE数据分析
  • ¥15 平板录音机录音问题解决
  • ¥15 请问维特智能的安卓APP在手机上存储传感器数据后,如何找到它的存储路径?
  • ¥15 (SQL语句|查询结果翻了4倍)
  • ¥15 Odoo17操作下面代码的模块时出现没有'读取'来访问
  • ¥50 .net core 并发调用接口问题
  • ¥15 网上各种方法试过了,pip还是无法使用
  • ¥15 用verilog实现tanh函数和softplus函数
  • ¥15 Hadoop集群部署启动Hadoop时碰到问题
  • ¥15 求京东批量付款能替代天诚