能否实现绕开反爬获取网页元素并发送给python

网页反爬机制比较厉害，尝试selenium＋mitmproxy也破不了。网页是socket发送信息的。
逻辑很简单，我的目标是直接获取网页加载完毕后某个时点的页面信息然后发送到python中处理。

现在通过chrome的 web scraper插件，可以获取到相关信息，但是爬到的数据只能下载到电脑中再进行处理。有没有办法能直接发送至python中？
此外，通过mitmproxy可以获取到socket发送的信息，但是解析太困难了，有没有办法通过mitmproxy或其他工具直接获取页面elements，就是最表明的东西，不需要深层次的socket信息。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
咕泡-三木 2021-08-06 17:24
关注
python监听个服务，比如HTTP啥的
然后其他程序获取到数据通过HTTP发生给python，python就可以继续处理了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【python高阶】-2- 线程和进程的并发
2025-07-27 14:55

皮革院长干测开的博客队列：线程安全的传送带，生产者放、消费者取，不用自己加锁～线程池：小管家帮你管理线程，控制同时运行的线程数，避免资源浪费～：消费者吃完要告诉传送带，否则传送带会一直等，可能超时～二、线程并发 - 锁lock...
API逆向实战：Python破某电商App加密接口，绕开网页反爬，直接拿JSON数据，效率提3倍
2025-10-30 20:56

程序员威哥的博客本文介绍了如何通过逆向破解电商App接口来高效爬取数据，避开网页端的复杂反爬机制。主要内容包括： App接口优势：相比网页端，App接口直接返回JSON数据，避免了DOM解析；... Python实现：给出了生成
Python 并发编程：GIL 限制与解决方案
2025-03-29 15:30

需求变更劝退师的博客 GIL 是 CPython 解释器中的一个机制，它确保在同一时刻只有一个线程可以执行 Python 字节码。这意味着即使在多核处理器上运行，Python 线程也无法真正并行执行。GIL 的存在主要是为了简化内存管理，避免多线程程序中...
Python 并行新思路：不移除 GIL 的多核并发之道
2025-03-13 07:00

铭渊老黄的博客等另类解决方案，我们可以在不移除 GIL 的情况下，有效地利用多核 CPU 的能力，实现 Python 程序的并行计算和高并发性能。这意味着，即使在 Python 的多线程程序中，当调用这些 C 扩展库时，底层的 C 代码可以并行...
Python并发编程以及系统常用模块
2018-01-21 11:46

进程是程序的一次执行，它具有自己的内存空间和数据栈，不同进程间的信息不能直接共享，必须通过进程间通信（IPC）来交换数据。线程则是运行在同一个进程内的执行流，它们共享同一片数据空间，能够更容易地共享信息...
Python并发编程：多进程与Future的探索
2025-03-31 09:10

seiji morisako的博客本文深入探讨了Python中的并发编程，重点介绍了多进程和Futures的使用方法及其优势。通过对比和实例，展示了多进程在计算密集型任务中的应用，强调了隔离性、稳定性和绕开GIL限制的重要性。同时，分析了多进程带来的...
python并发访问list_python并发 1：使用 futures 处理并发
2020-12-21 10:19

weixin_39634067的博客作为Python程序员，平时很少使用并发编程，...现在这一篇还是《流畅的python》读书笔记，译者在这里把future 翻译为“期物”，我觉得不太合适，既然future不能找到一个合适的词汇，暂时还是直接使用 future 吧。co...
python自动化测试3:接口文档与用例
2024-09-21 11:36

python自动化测试中的接口测试是软件测试的重要组成部分，涉及对前后端交互接口的功能、性能等方面...接口测试的实施有助于及时发现接口设计和实现中的缺陷，确保接口的可用性和稳定性，是保证软件质量不可或缺的环节。
Python基础：并行与并发概念
2025-07-11 16:59

tataCrayon|啾啾的博客总的来说，Python多线程实质上是并发，其受限于GIL的存在。但Python可以通过asyncio或Multiprocessing绕过GIL。也可以通过 C/C++（如 Cython）或 Rust 编写扩展模块。这些模块在执行时不受 GIL 限制，可以充分利用...
python并发_Python并发（一）
2020-11-28 16:32

weixin_39797758的博客假设我们要从一个网站用Python程序下载5张图片，最传统的思路就是写个for循环挨个挨个下载，但是这样做有个缺点，就是除了第一张，每张图片都必须等待前一张图片下载完毕后，才可以开始下载。由于网络有很高的延迟，...
Python 并发系列 2 —— 各种并发方案的选择
2019-12-12 16:33

dfsj66011的博客二、异步 Python：不同形式的并发翻译自：Async Python: The Different Forms of Concurrency 随着 Python 3 的出现，我们听到了很多关于“异步（async）”和“并发（concurrency）”的讨论，人们可能会简单地...
python处理并发,Python 使用期物处理并发
2021-04-27 04:13

特大号先生的博客示例：网络下载的三种风格为了高效处理网络 I/O，需要使用并发，因为网络有很高的延迟，所以为了不浪费 CPU 周期去等待，最好在收到网络响应之前做些其他的事。为了通过代码说明这一点，我写了三个示例程序，从网上...
python处理并发_Python通过future处理并发问题
2020-12-21 02:28

weixin_39778393的博客如：Executor.submit()方法的参数是一个可调用的对象，调用这个方法后会为传入的可调用对象排定时间，并返回一个 future 客户端代码不能应该改变future的状态，并发框架在future表示的延迟计算结束后会改变期物的...
Learning Concurrency in Python
2017-11-01 09:49

在阅读本书的时候，读者应该注意理解上述提到的并发相关概念，并且了解如何在Python环境中利用各种库和工具实现这些概念。读者应该能够通过本书学会如何分析并发问题，选择合适的并发工具，并能够编写出高效、稳定和...
代码世界的闪电侠：GEvent 如何让 Python 并发‘飞’起来
2025-04-20 10:32

步子哥的博客在数字时代川流不息的信息洪流中，软件应用常常需要扮演“八爪鱼”的角色——...Python，作为编程界的瑞士军刀，虽然功能强大，但在应对这类高并发挑战时，传统的解决方案有时会显得力不从心。然而，江湖之中总有奇兵。
Python 使用future处理并发
2021-01-23 21:53

蜉蝣之羽，衣裳楚楚的博客 Python标准库的两个Future 1. concurrent.futures.Future 2.asyncio.Future 这两个类作用相同，都表示可能已经完成或尚未完成的延迟计算。 future封装待完成的操作，可以放入队列，完成的状态可以查询，得到结果后...
【Python并发编程指南】多进程、多线程、协程：该如何选择？
2025-11-01 00:32

雨夜的星光的博客关键区别在于：多进程适用于CPU密集型任务，通过独立进程绕开GIL实现真正并行；多线程适合I/O密集型任务，利用线程切换提升效率但受限于GIL；协程(asyncio)是I/O高并发的最佳选择，单线程即可管理上万任务。决策指南...
Python 全栈系列261 使用apscheduler
2024-08-18 00:09

yukai08008的博客通过这种方式，绕开了python单线程-单核的限制,也就是实现了并发每个程序是一个线程，这个是合理的。静态调度例如这样，会隔10启动一个worker，最多不超过5个。 from datetime import datetime import os from ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月6日

能否实现绕开反爬获取网页元素并发送给python

2条回答 默认 最新

问题事件

2条回答默认最新