外行咨询如何下载页面（非爬虫，只求是否有比复制粘贴更好的方法）

开篇说重点，我是外行，既然是外行，咱们就敞开了说外行话了。
最近有一个需求，需要将在网站上爬一些网页上的信息（外行有时也有内行的需求）。
本来外行人的操作手段，应该是挨个打开页面，将页面上的文字复制粘贴下来，然后再慢慢提取信息。以我们外行人的眼光来看，我用 PY THON实现登录一些网址，并复制粘贴下文字部分是最好了。但现实是我只能用requests来爬页面的yuan码，存成STR，勉强能从yuan码里用PYT HON的字符串处理功能要用的东西提出来，但才访了网站3次就不成功了，不知是不是被反爬了，我又设置了爬一个页面，休眠30秒，结果还是不行。
我的需求其实特简单，就生成一个二维列表如下：
[[页面链接, 网址上的TXT], [页面链接, 网址上的TXT]]
网址上的TXT，不是yuan码，只要复制、粘贴的效果就好，这样还能省掉不少我们外行根据看不懂的编码内容。
听说P YTHON 有 100万多个库，请问有能实现以上功能的办法吗？
在此代表外行人谢过内行人！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
RE_ABANDON 2021-07-21 16:56
关注
才三次，大概率是没有设置header和cookie。不用代码的情况下建议用后裔采集器或者八爪鱼试试，只要文字是以标签而非图片的形式呈现，应该就能获取到。用代码的话，requests库获取html，但前提是文字在html中，而不是由js或者请求接口来的。再用xpath定位html中的数据即可，还是有一定学习成本的。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

外行咨询如何下载页面（非爬虫，只求是否有比复制粘贴更好的方法） python
2021-07-21 16:35

回答 3 已采纳才三次，大概率是没有设置header和cookie。不用代码的情况下建议用后裔采集器或者八爪鱼试试，只要文字是以标签而非图片的形式呈现，应该就能获取到。用代码的话，requests库获取html，但前
python 外行星人入侵游戏 python 开发语言有问必答
2021-09-23 15:33

回答 1 已采纳首先你没把飞机的坐标传递给子弹啊，其次你画子弹的时候没有执行update，那它坐标永远不变啊
有没有人知道、外行人想了解 c++
2022-08-13 21:29

回答 2 已采纳（欢迎采纳）要花个大半年吧，毕竟东西还多：你还需要了解准备一堆东西：for example： DBC文件描述单个CAN网络的通信。这个信息足以监测和分析网络并模拟不是物理可用的节点（剩余的总线模
python爬虫获取下一页_外行学 Python 爬虫第六篇动态翻页
2020-11-25 14:25

weixin_39559523的博客前面几篇文章，初步完成了从网络请求、数据解析、...在实际页面中发现有很多的分页现象，通过前面的方式仅能获取第一页的内容，无法获取第二页的内容，这就造成无法爬取所有的页面，最终是获取到的数据比网站上的...
盖房子和开发程序哪个更难问答团队
2022-07-31 21:31

回答 1 已采纳难度的话，盖房子前期学习的成本更高，但是后面的话，会更加轻松一些，因为搞工程的都知道，这个到后面就是体力活还有人情世故了；除非你是设计师，还要考虑到结构构造以及外形设计上，否则你只是搬砖打工也不需要有
求解惑，cnn用在图像压缩，训练集作用是干什么的啊 cnn python 深度学习
2023-04-04 18:38

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这个问题的回答你可以参考下: https://ask.csdn.net/questions/7427258这篇博客你也可以参考下：浏览器上实现CN
如何编写一个程序能对windows系统设置进行更改 c语言 java python
2022-05-10 00:36

回答 1 已采纳这应该是有 registry （注册表）设置的，网络上查一下就好，我看到的是，用 regedit 修改这个： HKEY_CURRENT_USER\Software\Microsoft\Win
python提取网页中p标签中的内容_外行学 Python 爬虫第三篇内容解析
2020-11-20 08:28

weixin_39667652的博客从网络上获取网页内容以后，需要从这些网页中取出有用的信息，毕竟爬虫的职责就是获取有用的信息，而不仅仅是为了下来一个网页。获取网页中的信息，首先需要指导网页内容的组成格式是什么，没错网页是由 HTML「我们...
什么是OOPS中的函数重载和覆盖，用外行术语解释[重复] php
2016-09-26 10:06

回答 3 已采纳 Method Overriding Method Overloading Simple Explanation Method Overriding is when a method defi
怎么样使用js和html，css网页自动按顺序读取本地文件里最新的每天的大量txt文本文件，并且把文本从下行到上行翻过来并且自动换行，然后放到网页里展示 javascript
2022-02-19 00:26

回答 3 已采纳不是浏览器做的功能，要自动读取一般都是通过web服务器来实现。如果只熟悉js，可以用nodejs搭建web服务器然后用fs模块读取文件简单示例如下 app.js var http = requir
关于#U盘无法检测到#的问题，如何解决？其他常见问题FAQ 硬件工程
2023-03-12 10:26

回答 2 已采纳现在问题已经解决了,也是第二种方法的错误提示给了我启发.是个什么牛马原因呢,我在合并分区的时候,全部合并进了启动分区*里,这就导致了磁盘其实真正意义上未分配盘符,但磁盘已被锁定且被保护.也无法在常态下
python爬虫翻页_外行学 Python 爬虫第六篇动态翻页
2020-11-21 00:29

weixin_39956110的博客前面几篇文章，初步完成了从网络请求、数据解析、...在实际页面中发现有很多的分页现象，通过前面的方式仅能获取第一页的内容，无法获取第二页的内容，这就造成无法爬取所有的页面，最终是获取到的数据比网站上的...
刚重装完系统远程客就已经在我电脑里了，这是他之前连接了什么？ java
2021-08-25 17:18

回答 5 已采纳 C盘不格式化重装系统也是不行的。要把重要文件备份到电脑以外的U盘里，然后把电脑里所有的盘都格式化（不要快速格式化）最好重新分区之后，不联网的情况下，再重装正版系统。并且电脑不要再使用备份的U盘。
Python爬虫工程师是干什么的？
2021-10-27 15:21

　　꧁爬虫攻城狮꧂的博客程序员有时候很难和外行人讲明白自己的工作是什么，甚至有些时候，跟同行的人讲清楚“你是干什么的”也很困难。比如我自己，就对Daivd在搞的语义网一头雾水。所以我打算写一篇博客，讲一下“爬虫工程师”的工作内容...
Python爬虫，你是否真的了解它？
2019-12-12 15:36

轻松学Python的博客程序员有时候很难和外行人讲明白自己的工作是什么，甚至有些时候，跟同行的人讲清楚“你是干什么的”也很困难。比如我自己，就对Daivd在搞的语义网一头雾水。所以我打算写一篇博客，讲一下“爬虫工程师”的工作内容...
金融外行如何入门量化交易 - 用Python的交易员 - 知乎 Live.mhtml
2021-09-13 12:10

金融外行如何入门量化交易 - 用Python的交易员 - 知乎 Live.mhtml
【python教程入门学习】Python爬虫入门并不难，甚至入门也很简单
2021-10-11 15:50

梦魇java的博客比如你要做一个推荐系统，那么你可以去爬取更多维度的数据，做出更好的模型。 3.爬取优质的资源：图片、文本、视频爬取游戏内的精美图片，获得图片资源以及评论文本数据。掌握正确的方法，在短时间内做到能够
一般人有必要学python吗_外行人有必要学习python吗?
2021-02-05 02:39

weixin_39909859的博客都说Python好学，薪资待遇好，前景好，其实你想一下，现在对于互联网的发现速度已经到了一个高度了，需求没有转变的话都去学Python做的事情也就这几种，人才拥挤，轮得到你！那就供过于求，另外外行人入门编程不是...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月21日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效

外行咨询如何下载页面（非爬虫，只求是否有比复制粘贴更好的方法）

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新