要扒的网站更新了，怎么看到他的老网站扒下来

本来扒的网站今天发现是空白的，再去看这个网站更新了，怎么能查看到他的更新前的网站样子并且扒下来呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间新星创作者: 前端开发技术领域 2024-04-01 10:46
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
问题分析：我们需要找到一种方法来查看网站更新前的页面，并将其扒下来。通常情况下，网站的更新都是通过更改网页代码、添加、删除或修改元素的方式进行的。因此，我们可以通过比较更新后网页代码与更新前网页代码的差异，找到更新之前的网页。解决方案： 1.使用网页快照工具：这种方法可以查看网站更新前的页面快照并将其保存。例如，可以使用Wayback Machine这样的网页快照工具，它可以提供历史页面快照，用户可以选择查看历史快照并将页面保存为HTML文件。步骤如下：（1）打开Wayback Machine网站（https://archive.org/web/）; （2）在搜索框中输入要查询的网站URL，然后点击"go"按钮; （3）选择日期，查看以前的网页快照; （4）保存页面快照为HTML文件。 2.使用比较工具：这种方法可以比较更新前后的网页代码，找到差异并将更新之前的网页扒下来，实现该方法需要掌握一些基本的编程技巧、比较工具等（如difflib、WinMerge等）。具体步骤如下： (1)抓取更新后页面的HTML代码并保存为文件； (2)使用抓取更新前页面的HTML代码并保存为文件； (3)使用比较工具(如difflib、WinMerge等),比较两份代码的差异； (4)找到更新前页面的代码，将其保存至本地。案例代码示例： import requests import difflib url = "需要查询的网站URL" response_new = requests.get(url) # 抓取更新后的页面HTML代码 with open("new.html", "w", encoding='utf-8') as file: # 保存HTML代码至文件
file.write(response_new.text)

snapshot_url = "https://web.archive.org/save/"+ url # 生成页面历史快照 requests.get(snapshot_url) response_old = requests.get(snapshot_url + "?_timestamp=20220101000000") # 获取历史快照 with open("old.html", "w", encoding='utf-8') as file: # 保存页面历史快照HTML代码至文件 file.write(response_old.text)

使用difflib进行比较，找出更新前的HTML代码

old_html_list = response_old.text.splitlines() new_html_list = response_new.text.splitlines() result = list(difflib.unified_diff(old_html_list, new_html_list)) for line in result: if line.startswith('-'): print(line[1:].strip()) #打印更新前HTML代码 with open("old.html", "w", encoding='utf-8') as file: # 将HTML代码保存至文件 file.write(line[1:].strip()) break
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

扒站工具看好哪个网站,指定好URL,自动扒下来做成模版
2021-05-24 17:27

在描述中提到的“指定好URL,自动扒下来做成html模版”，意味着这种工具可以自动化处理整个过程，从输入目标网站的URL到生成可编辑的HTML文件，提供了一个便捷的方式来进行网站克隆。首先，我们需要理解什么是扒站...
扒前端网页代码工具，Teleport Ultra
2022-05-29 09:57

在网上经常看到一些很好看的页面，这些页面其实都可以把代码扒取下来的，可以用浏览器的另存为，也有一些相应的软件。扒前端网页源码工具，软件名称Teleport Ultra 方便快捷，十分简单，傻瓜式安装和应用适合新手...
前端扒代码_怎么快速扒下来一个网站所有的前端页面？
2020-12-24 12:31

weixin_39921023的博客用chrome浏览器打开你喜欢的网站右键点击，在弹出菜单中选中查看框架的源代码(如图所示)在COPYWEB文件夹中新建...亲，勿摔鼠标，请往下看，加入CSS文件你就能看见你想要拥有的网站炫酷的外衣。(2)扒CSS样式在框架源...
扒网站界面神器(一键下载：html,css,js,img等文件)
2022-06-03 06:12

扒网站界面神器(一键下载：html,css,js,img等文件)扒网站界面神器(一键下载：html,css,js,img等文件)扒网站界面神器(一键下载：html,css,js,img等文件)扒网站界面神器(一键下载：html,css,js,img等文件)扒网站界面...
《Teleport Ultra：高效前端网页代码扒取工具》
2025-08-04 09:32

在互联网上，我们常常会看到一些设计精美、风格独特的网页。这些网页的前端代码其实可以通过一些方法获取。比如，利用浏览器自带的“另存为”功能，就可以将网页保存下来，进而查看其代码。此外，还有一些专门的软件...
扒网站php,php批量扒取网站内容
2021-04-10 10:07

Fkvision的博客网站内容竟然不让复制，这样搞，怎么让我们考试的时候弄小抄，难不成要一个字一个字的去打不成。所幸的是咱是搞技术的，这点问题还是难不倒的，你不让复制刚好，这下我还懒得麻烦呢。直接搞个脚本把这一课的内容全扒...
在线扒站网PHP源码-在线扒站工具网站源码-一键扒取网站源代码.zip
2024-01-25 22:21

这是一款在线的网站模板下载程序，也就是我们常说的扒站工具，利用它我们可以很轻松的将别人的网站模板样式下载下来，这样就可以大大提高我们编写前端的速度了！注：扒取的任何站点不得用于商业、违法用途，仅供个人...
web前端网站源码抓取工具
2018-07-23 10:17

我们难免会看到一些让人心动的网站，于是自己想把它搞下来，自己手工一个文件一个文件把它保存下来也可以实现，完成了也累得够呛，有一款扒站的神器，可以把你所喜欢的目标网站整个网站给扒下来，这个神器就是...
如何快速获取网页源码(直接把网站的 js css html 扒下来的)
2022-10-18 12:00

pch平凡之路的博客我们在学习和研究的时候,或者看到非常酷炫的页面效果，需要网站的源代码进行借鉴，但每次需要下载网站源代码，我们都需要找到一个，下载一个，每次只能下载一个文件，非常缓慢，而且还要自己拼凑一下源代码文件。...
很好用的网站前端页面爬取工具
2019-10-10 10:34

网站前端页面爬取工具是IT领域中用于自动化获取网页数据的重要工具，对于数据分析、网站镜像、搜索引擎优化等场景有着广泛的应用。本文将详细介绍这类工具的功能、工作原理以及相关技术。首先，我们要理解什么是...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月1日

要扒的网站更新了，怎么看到他的老网站扒下来

2条回答 默认 最新

使用difflib进行比较，找出更新前的HTML代码

问题事件

2条回答默认最新