python 今日头条的_signature如何生成 急急急!!!!

有没有大神用python爬取过今日头条的数据啊?
数据可以爬取下来,但是会受as,cp,_signature的影响,签名的影响还挺大的。。。
有没有大神可以指导一二???
感激不尽!!!
备注:as、cp用在google浏览器控制台里用ascp.getHoney()可以获取,源码还看得懂,
但是_signature 利用TAC.sign(),这个方法就看不懂了啊。。。。

解决方法:利用Python的selenium方法直接调用TAC.sign(参数)。
有需要的朋友可以尝试一下。

4个回答

解决部分代码如下:
from selenium import webdriver// 先导入selenium模块,没安装的自行百度安装就好
firefox = webdriver.Firefox()
firefox.get('https://www.toutiao.com/ch/news_fashion/')// 头条链接
ascp = firefox.execute_script('return ascp.getHoney()') // 获取连接中的as与cp的值
sinature = firefox.execute_script('return TAC.sign(' + str(user_id) + str(max_behot_time) + ')')// 获取链接中的sinature的值

qq_37736792
qq_37736792 纠正一波(方法是可以正常使用的):给大家一个参考链接:https://www.toutiao.com/c/user/5954781019/#mid=5954781019这个链接底下,打开控制台,输入ascp.getHoney(),与TAC.sign(),都是有对应输出的
大约 2 年之前 回复
qq_37736792
qq_37736792 纠正一波(方法是可以正常使用的):给大家一个参考链接:https://www.toutiao.com/c/user/5954781019/#mid=5954781019
大约 2 年之前 回复
qq_37736792
qq_37736792 纠正一波(方法是可以正常使用的):给大家一个参考链接:https://www.toutiao.com/c/user/5954781019/#mid=5954781019
大约 2 年之前 回复
qq_37736792
qq_37736792 回复qq_41096513: 试了一下,好像现在这个方法不行了。头条应该又改版升级了吧
大约 2 年之前 回复
qq_37736792
qq_37736792 回复qq_41096513: 你用浏览器看请求头条数据的参数,里面就有user_id
大约 2 年之前 回复
qq_41096513
qq_41096513 回复qq_37736792: signaturea破解哪个大神知道怎么弄啊
2 年多之前 回复
qq_41096513
qq_41096513 你这里面的user_id参数是什么啊
2 年多之前 回复
qq_37736792
qq_37736792 呃呃,就是很普通的get数据请求呀
2 年多之前 回复
qq_37736792
qq_37736792 回复hhf314: 呃呃,就是很普通的post数据请求呀
2 年多之前 回复
qq_37736792
qq_37736792 回复prog_li: PhantomJS好像是会存在问题,最好是使用火狐。无头请求的支持不太友好
2 年多之前 回复
hhf314
统万城城主 我用了你的方法确实可以拿到as,cp,_sinature,拼接好url发起请求,不过拿不到数据,可以把拼接url,和发起请求的代码展示一下吗?冒犯之处,还望见谅!
2 年多之前 回复
prog_li
prog_li 我使用了你的方法,但是把获取到的值拼接上接口链接依然是不对的,我用的是PhantomJS,难道必须火狐才能抓取到正确的值?
2 年多之前 回复

他url的方式挺多的,不知道你具体的抓哪一个

qq_37736792
qq_37736792 试了一下,好像现在这个方法不行了。头条应该又改版升级了吧
大约 2 年之前 回复
weixin_40520732
Jackwu01 你好,请问“as、cp用在google浏览器控制台里用ascp.getHoney()可以获取“,这是怎么得来的?本人菜鸟一枚,还请大佬赐教。
2 年多之前 回复
httzjj
EdgeCalculation 回复chiquxie2751: 你弄出来了吗
接近 3 年之前 回复
chiquxie2751
chiquxie2751 刚好也碰到这个问题,不知楼主解决了没有??
接近 3 年之前 回复
qq_37736792
qq_37736792 回复qq_19245589: 啊啊啊。我知道了。谢谢你啊。数据不对是跟cookie有关系。谢谢你了
接近 3 年之前 回复
qq_19245589
qq_19245589 回复qq_37736792: 个人感觉结果不同应该不是受该参数的影响,这种参数,一般不会起到决定作用,主要是用来标记请求
接近 3 年之前 回复
qq_37736792
qq_37736792 看了源码,那个sinature是根据一些时间戳与作者id绑定的,所以获取数据就不太对呢
接近 3 年之前 回复
qq_37736792
qq_37736792 回复qq_19245589: 是有影响的。随便填是可以获取到数据。但是数据不全
接近 3 年之前 回复
qq_19245589
qq_19245589 回复qq_37736792: 我看过了,这个_signature貌似是通过计算得到的一个请求的类似认证标记的东西,并不影响实际的返回结果,你随便填入值都可以得到结果,不影响你的实际所得
接近 3 年之前 回复
qq_37736792
qq_37736792 不是抓取数据,而是请求的的链接中有个signature的参数,例如这个:https://www.toutiao.com/api/pc/feed/?category=news_hot&utm_source=toutiao&widen=1&max_behot_time=0&max_behot_time_tmp=0&tadrequire=true&as=A1351A02D6E10A4&cp=5A26F1D01A841E1&_signature=AwJrKAAAWSmDKyhX9sC-kQMCaz_signature参数的生成方法
接近 3 年之前 回复

头条的表单现在花样越来越多了,as和cp这个生成方式网上有 我就不发了,剩下的一个时间戳和一个——signature,刚给你看了下:图片说明

qq_37736792
qq_37736792 试了一下,好像现在这个方法不行了。头条应该又改版升级了吧
大约 2 年之前 回复
qq_41096513
qq_41096513 回复qq_37736792: signaturea破解哪个大神知道怎么弄啊
2 年多之前 回复
qq_33397962
小白也有大牛梦 回复大蛇王:你这是自己解密了吗 ?原来的js不是加密的吗?
接近 3 年之前 回复
t8116189520
大蛇王 回复qq_37736792: 兄弟,再这么问下去可就要收费了,我建议你还是phontomjs+selenium爬虫,简单粗暴,一步到胃
接近 3 年之前 回复
qq_37736792
qq_37736792 回复大蛇王: 搜索TAC会看到文件最后有一个Function ,后面还是乱码。。。实在无解
接近 3 年之前 回复
qq_37736792
qq_37736792 回复大蛇王: 我看到这个了,可是那个TAC.sign太难了
接近 3 年之前 回复
qq_37736792
qq_37736792 回复大蛇王: 我看到这个了,可是那个TAC.sign太难了
接近 3 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐