刚开始学网络爬虫遇到了一点问题

题目：编写爬虫程序，爬取学院新闻主页中的新闻信息，包括：新闻标题，新闻时间，链接，并将这些信息转存为Excel文档。
想问问能不能提供一下思路！！

还有一个就是：
tds = tr('td')

        st0 = tds[0].string
        st4 = tds[4].string
        ulist.append([st0.strip(),tds[1].a.string,st4.strip()])

这一步不是很能理解，请大家提供一下思路，谢谢~

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-09-24 17:18
关注
1.可以尝试使用requests.get进行请求，2.使用bs4对页面进行解析，3.获取节点属性值。图中就是先获取节点tds列表，然后用索引取其中字符串值。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫学习中遇到的问题 python 爬虫
2023-02-14 11:17

回答 4 已采纳该回答引用ChatGPT根据错误信息，这个问题可能是由于连接超时或网络连接不可用导致的。因此，建议您检查以下几个方面：确保您的网络连接正常并且能够访问请求的地址。确保请求的地址正确且存在，尝试在浏览
用python做爬虫遇到的问题 python 爬虫
2021-09-11 14:26

回答 2 已采纳
Python院士爬虫遇到了问题 python 爬虫
2022-06-12 23:13

回答 1 已采纳 except后面可以加 e，然后打印e。类似 except Exception as e: print("未知异常：%s" % e) 另外，你这样创建启动进程，似乎有点多。最
Python与爬虫有什么关系？Python为什么叫爬虫_网络爬虫与python
2024-04-29 03:42

m0_60721860的博客 Python爬虫通过URL管理器，判断是否有待爬URL，如果有待爬URL，通过调度器进行传递给下载器，下载URL内容，并通过调度器传送给解析器，解析URL内容，并将价值...代码十分的简洁方便，是新手学习网络爬虫选择编程语言。
python 爬虫刚开始学习的一个问题 python 爬虫
2017-09-14 08:55

回答 4 已采纳你自己建的py文件起名字不要和python的包名一样！问题应该出在这里，你自己写的threading.py文件把python的threading覆盖了
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
python爬虫面试常见问题_学爬虫面试要注意什么(1)
2024-04-30 16:13

Ndk开发校长的博客是否了解网络的同步和异步？同步：提交请求->等待服务器处理->处理完毕返回这个期间客户端浏览器不能干任何事异步: 请求通过事件触发->服务器处理（这是浏览器仍然可以作其他事情）->处理完毕链表和顺序表储存时...
python 爬虫正则表达式打印遇到问题 python 正则表达式爬虫
2021-12-30 23:54

回答 2 已采纳 ulrs = re.findall('<img src="(.*?)" alt=".*?">', html) 改成这样就行了，有帮助的话采纳一下哦！谢谢！
学习用seleium学习爬虫时遇到的问题 python selenium 有问必答爬虫
2022-07-17 22:19

回答 2 已采纳页面初始就是只有5个class是_qlq27g的div之后是用js动态更新到20个的用time.sleep(5)延时一下,等到js动态更新后再获取即可你题目的解答代码如下： from selenium
seleium学习爬虫技术遇到的问题 python selenium 有问必答爬虫
2022-07-08 23:33

回答 3 已采纳你"iframe[title=’livere‘]"中单引号(')写成了中文全角的，要改成英文半角的。并且你页面中没有title='livere'的iframe只有title='livere-comme
超牛逼！Python爬虫学习的完整路线推荐_爬虫三部曲
2024-05-02 14:08

2401_84139697的博客商机发现：招投标情报发现、客户资料发掘、企业客户发现等进行爬虫学习，首先要懂得是，那些我们肉眼可见的光鲜亮丽的网页是由这些源码被浏览器所识别转换成我们看到的网页，这些源码里面必定存在着很多**。...
学习python爬虫，这个绝对够了！(呕心沥血3.7万字，只为博君一赞！)python爬虫笔记之一
2024-04-28 00:56

走着足迹的博客 python爬虫的深度着实让我吃惊且吃力，仅仅笔记的第一篇就有3.7万字的强度，看来，想要在python爬虫领域登峰造极，要狠狠下一番功夫了！！！为什么不直接把笔记全发出来呢？主要是才就3.7万字，CSND的编辑器就卡的...
为什么Python是编写网络爬虫的最佳选择？_python是最好的爬虫语言吗
2024-04-28 00:11

2401_84140816的博客 Python 是用于网络抓取的最佳语言，Python生态有非常多的构建网络爬虫的工具和框架。这些工具和框架通常具有高性能，并且易于使用，可通过简单明了的语法进行集成。除了上述优势外，Python强大的数据处理能力，社区...
手机Python爬虫教程：利用手机学习Python爬虫的终极指南_python可以在手机上写爬虫吗
2024-05-03 10:06

2401_84557402的博客这本经典的Python爬虫书籍可以在手机上下载电子版进行阅读。书中详细介绍了爬虫的原理和技术，并提供了大量实例和项目供你学习。通过手机电子书籍的形式，你可以随时阅读，不受时间和地点的限制。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月24日

悬赏问题

¥15 请问有用MZmine处理 “Waters SYNAPT G2-Si QTOF质谱仪在MSE模式下采集的非靶向数据” 的分析教程吗
¥50 opencv4nodejs 如何安装
¥15 adb push异常 adb: error: 1409-byte write failed: Invalid argument
¥15 nginx反向代理获取ip，java获取真实ip
¥15 eda：门禁系统设计
¥50 如何使用js去调用vscode-js-debugger的方法去调试网页
¥15 376.1电表主站通信协议下发指令全被否认问题
¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
¥15 复杂网络，变滞后传递熵，FDA
¥20 csv格式数据集预处理及模型选择

刚开始学网络爬虫遇到了一点问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新