在PHP中模拟HTML5 LocalStorage

我正在制作一个机器人来废弃并从网页中提取数据。 一些网站需要cookie,出于安全原因,他们会在客户端的cookie中保存一些特定的sata,以便在每个请求中对其进行验证。 现在我遇到了一种新的测量方法,其中网站保持相同的想法,但它不使用cookie,而是使用HTML5 LocalStorage。
我的问题是,有没有任何已知的方法来模拟LocalStorage读/写,如果没有 ,有什么想法吗?</ p>

我的第一个想法是解析使用LocalStorage的javascript代码并处理php变量中的读/写,这至少可以用于某些基本的 已知的操作。</ p>
</ div>

展开原文

原文

I am making a bot to scrap and extract data from web pages. Some websites require cookies, they save some specific sata in the client's cookies to verify it in every request, for security reasons. Now i got stuck with a new type of measure in which the website keeps the same idea, but instead of using cookies, it uses HTML5 LocalStorage. So my question is, is there any know way to simulate LocalStorage read/write, if not, is there any idea to do it?

my first thought is to parse the javascript code that uses the LocalStorage and handle read/writes in php variables, this would work at least for some basic known operations.

douzhenyu6533
douzhenyu6533 你是对的,我在突尼斯,这里的一切都是合法的。在我的上一篇评论中,我谈论的是php的DOM扩展
大约 7 年之前 回复
doulan4371
doulan4371 你在说什么查询选择器?您可以在JS上运行正则表达式,但这只是一个次优的解决方案。网站所有者只需更改其代码,您的代码就会停止工作。(顺便说一句,你知道刮网站和显示数据是非法的,至少在某些国家?)
大约 7 年之前 回复
dongyuli0964
dongyuli0964 是的,我们至少可以找到<script>标签和重新分析查询选择器。那就够了吗?(我是绝望的大声笑)
大约 7 年之前 回复
douchuilai2355
douchuilai2355 不,它只解析XML或HTML,因此您只能获得XML/HTML标记树。
大约 7 年之前 回复
drjltlm156790
drjltlm156790 不能php自己的DOM扩展补偿这个?
大约 7 年之前 回复
dongpa3109
dongpa3109 我从来没有使用过这个扩展,但是V8(底层库)没有任何与DOM相关的功能(只有纯ECMAScript)。
大约 7 年之前 回复
duanlian1960
duanlian1960 有人试过吗?php.net/manual/en/book.v8js.php
大约 7 年之前 回复
dongmi0760
dongmi0760 那不行。如果你想支持基于JavaScript的页面,你很可能需要像nodejs的JSDom这样的东西,这样你就可以在网站上运行javascript。但是,我不认为有很多网站需要使用局域网存储并且根本不使用cookie而不使用JavaScript......甚至谷歌等搜索引擎也不支持大多数仅限javascript的网站。
大约 7 年之前 回复
douxun7992
douxun7992 不,我想要制作一个已知操作的列表,但不只是任何javascript代码
大约 7 年之前 回复
drnmslpz42661
drnmslpz42661 你可以用机器人执行JavaScript吗?
大约 7 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问