from lxml import etree
import requests
url = 'https://www.bilibili.com/video/BV1oW411r7fM/?spm_id_from=333.788.recommend_more_video.1'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)'
' Chrome/80.0.3987.87Safari/537.36 SE 2.X MetaSr 1.0 '
}
response = requests.get(url=url,headers=headers).text
tree = etree.HTML(response)
li_list = tree.xpath('//*[@id="multi_page"]/div[2]/ul/li')
print(li_list)
for li in li_list:
title = li.xpath('./a/div/div[1]/span[2]')
print(title)
爬虫获取标题 返回值为空
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
关注 我觉得是后面的XPath语法要换种写,我试了后面的改成.//span[@class="part"],但是结果还是为空。
浏览器的XPath helper生成的XPath有时候用到Python中会没用。
我现在几乎已经放弃lxml的etree,老是返回空值,我现在用正则比较多解决 无用评论 打赏 举报
悬赏问题
- ¥20 Keil uVision5创建project没反应
- ¥15 mmseqs内存报错
- ¥15 vika文档如何与obsidian同步
- ¥15 华为手机相册里面的照片能够替换成自己想要的照片吗?
- ¥15 陆空双模式无人机飞控设置
- ¥15 sentaurus lithography
- ¥100 求抖音ck号 或者提ck教程
- ¥15 关于#linux#的问题:子进程1等待子进程A、B退出后退出(语言-c语言)
- ¥20 web页面如何打开Outlook 365的全球离线通讯簿功能
- ¥15 io.jsonwebtoken.security.Keys