LLLeaa 2018-04-06 08:41 采纳率: 0%
浏览 1567
已结题

Pixiv.net上通过XPath Helper可以准确获取到想要的,在Python里却无法获取到

图片说明

网址为https://www.pixiv.net/search.php?s_mode=s_tag&word=%E3%83%8A%E3%83%AB%E3%83%88%20OR%20(%20Naruto%20)&order=popular_d

我发现F12查看到的和右键查看到的源代码不一样,Python里返回的是右键查看到的。我该怎么做才能提取到我想要的“/member_illust.php?mode=medium&illust_id=47221440”?
# 获取返回页面数值
page_html = requests.get(html, headers=headers)
# 将html的div 转化为 xml
xmlcontent = etree.HTML(page_html.text)
# 解析HTML文档为HTML DOM模型
# 返回所有匹配成功的列表集合
link_list = xmlcontent.xpath('//div[@class="layout-body"]//div[@class="_25taFA4"]//a[@class="gtm-recommend-illust gtm-thumbnail-link _1wlaFo6"]/@href')
# 直接提取第一个href
for link in link_list:
print(link)

  • 写回答

3条回答

  • devmiao 2018-04-06 15:55
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 怀疑手机被监控,请问怎么解决和防止
  • ¥15 Qt下使用tcp获取数据的详细操作
  • ¥15 idea右下角设置编码是灰色的
  • ¥15 全志H618ROM新增分区
  • ¥15 在grasshopper里DrawViewportWires更改预览后,禁用电池仍然显示
  • ¥15 NAO机器人的录音程序保存问题
  • ¥15 C#读写EXCEL文件,不同编译
  • ¥15 MapReduce结果输出到HBase,一直连接不上MySQL
  • ¥15 扩散模型sd.webui使用时报错“Nonetype”
  • ¥15 stm32流水灯+呼吸灯+外部中断按键