大龄新手91 2021-10-07 17:49 采纳率: 0%
浏览 27

爬虫获取标题 返回值为空

from lxml import etree
import requests

url = 'https://www.bilibili.com/video/BV1oW411r7fM/?spm_id_from=333.788.recommend_more_video.1'
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)'
                      ' Chrome/80.0.3987.87Safari/537.36 SE 2.X MetaSr 1.0 '
    }
response = requests.get(url=url,headers=headers).text
tree = etree.HTML(response)
li_list = tree.xpath('//*[@id="multi_page"]/div[2]/ul/li')
print(li_list)
for li in li_list:
    title = li.xpath('./a/div/div[1]/span[2]')
    print(title)
  • 写回答

1条回答 默认 最新

  • knighthood2001 Python领域优质创作者 2021-10-07 18:38
    关注

    我觉得是后面的XPath语法要换种写,我试了后面的改成.//span[@class="part"],但是结果还是为空。
    浏览器的XPath helper生成的XPath有时候用到Python中会没用。
    我现在几乎已经放弃lxml的etree,老是返回空值,我现在用正则比较多

    评论

报告相同问题?

问题事件

  • 创建了问题 10月7日

悬赏问题

  • ¥20 Keil uVision5创建project没反应
  • ¥15 mmseqs内存报错
  • ¥15 vika文档如何与obsidian同步
  • ¥15 华为手机相册里面的照片能够替换成自己想要的照片吗?
  • ¥15 陆空双模式无人机飞控设置
  • ¥15 sentaurus lithography
  • ¥100 求抖音ck号 或者提ck教程
  • ¥15 关于#linux#的问题:子进程1等待子进程A、B退出后退出(语言-c语言)
  • ¥20 web页面如何打开Outlook 365的全球离线通讯簿功能
  • ¥15 io.jsonwebtoken.security.Keys