Python3.9爬文章标题和url

求大佬解答，整了一个小时都没搞懂，爬的是网站首页的文章标题和url，代码都对，路径也没错，也出来了uuu.txt，但是里面没内容(┯_┯)
网站url代码里有。

代码如下
import requests
from lxml import etree

headers = {
'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.57"
}

url = 'http://xb.xsqk.ccut.edu.cn/gwqk/list.htm'

response = requests.get(url=url, headers=headers)

page_text = response.text
tree = etree.HTML(page_text)

tr_list = tree.xpath('/html/body/div/div[2]/table[3]/tbody/tr/td/table/tbody/tr/td[3]/table[4]/tbody/tr/td/div/div/div[1]/table/tbody/tr')

with open('./uuu.txt', 'w', encoding='utf-8')as fp:
for tr in tr_list:
title = tr.xpath('.//a/@title')[0]
href = 'http://xb.xsqk.ccut.edu.cn/gwqk/list.htm' + tr.xpath('.//a/@href')[0]
fp.write(title + href + '\n')
fp.close()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Harley~G 2021-12-21 09:44
关注
你的tr_list里面取到的值就为空，肯定没数据存进去

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

blog-app:博客应用程序项目基于Django 3.1和Python 3.9
2021-04-04 13:40

**博客应用程序项目基于Django 3.1和Python 3.9** 在现代Web开发中，Django是一个非常流行的开源框架，它使用Python语言构建高效、可扩展且易于维护的Web应用。本项目"blog-app"是利用Django 3.1版本和Python 3.9来...
Miniconda-Python3.9环境下使用BeautifulSoup爬取网页
2025-12-30 17:20

青菜炒蛋的博客通过Miniconda创建独立Python环境，结合BeautifulSoup与requests高效提取网页数据，解决编码、动态加载与反爬等常见问题，实现稳定可复现的爬虫开发流程。
win11+python3.9+pycurl39+wfuzz3.1.0
2023-04-10 10:45

woai_zhongguo的博客安装wfuzz python3.9 -m pip install wfuzz //使用pip安装。如果你存在多个版本的python，就使用对应版本的pip进行安装即可，直接输入pip安装可能会出现安装位置错位问题；如果你仅有一个python，则请忽略。安装...
python 简单应用——网络爬虫AND数据分析
2024-12-16 16:42

爱喝冰美式的猫猫的博客 python实现对网站的爬取和对疫情数据分析
从零开始学习Python爬虫：入门指南
2025-07-06 20:31

程序员威哥的博客文章还提供了常见问题解决方案和学习建议，强调理解网页结构和模拟人类行为的重要性，最后指出爬虫仅是数据工程的第一步，为后续数据清洗和分析奠定基础。适合零基础开发者快速上手Python爬虫。
【python博客爬虫】
2022-10-16 12:28

番茄味老鼠冲浪的博客 python 博客爬虫自己写的谨慎借鉴，小白
Python微信公众号文章爬虫与内容聚合平台实现
2025-08-23 23:01

Python爬虫项目的博客本文详细介绍基于Python的微信公众号文章爬取与内容...文章将深入探讨爬虫策略、反爬应对、数据清洗和聚合算法等关键技术，并提供完整代码实现。关键词：Python爬虫、微信公众号、内容聚合、Scrapy-Redis、反爬虫策略。
Python爬虫解析（新手快速入门）
2022-03-28 17:02

捣蛋深的博客由于参加数学建模的需要，在这个寒假期间小学了一下爬虫（Python学习），想着我记性这么差，还是得对这段时间的学习进行整理，以防忘记。一、爬虫介绍网络爬虫又称网络蜘蛛、网络机器人，是指按照某种规则在网络上...
Python爬虫大作业（仿虎牙直播客户端）
2022-04-08 13:17

Zemoey的博客结合所选专业方向（信息处理、嵌入式、人工智能、大数据处理），用所学Python技术设计并实现一个与专业方向技术相关的、功能完整的系统，并撰写总结报告。实现要求：（1）实现涵盖以下技术：图形界面、多线程、...
python爬虫下载文件到指定文件夹_手把手教你用Python实现分布式爬虫(四) - scrapy爬取技术文章网站...
2020-11-23 12:48

weixin_39998541的博客搭建scrapy的开发环境，本文介绍scrapy的常用命令以及工程目录结构分析，本文中也会详细的讲解xpath和css选择器的使用。然后通过scrapy提供的spider完成所有文章的爬取。然后详细讲解item以及item loader方式完成...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月20日

Python3.9爬文章标题和url

1条回答 默认 最新

问题事件

1条回答默认最新