php 怎么利用editthiscookie得到的cookie跳过淘宝登陆并且抓取个人信息

在csdn看到了一篇是用爬虫Scrapy利用EditThisCookie获取cookie跳过登陆验证,那么php能不能有什么办法是跳过淘宝的登录验证获取数据呢,比如获取一些个人的基本信息和交易数据?

2个回答

也就能获取你自己的信息,别人的cookie就不用想了。。。获取cookie直接f12看浏览器发送的请求中附带的cookie全部拷贝出来附加到发送请求测curl上就行了

hzjxiong03
hzjxiong03 技术更新了吗
4 个月之前 回复
hzjxiong03
hzjxiong03 怎么设置了之后,还是返回这样的,x5secdata=5e0c8e1365474455070961b803bd560607b52cabf5960afff39b64ce58073f7844a8dd94c89edef01
4 个月之前 回复
qq_34461215
大叔的php之路 curl_setopt($curl, CURLOPT_COOKIE, $cookie); cookie带上就行
一年多之前 回复
showbo
支付宝加好友偷能量挖 回复weixin_40871771: https://blog.csdn.net/clh604/article/details/38759779
一年多之前 回复
showbo
支付宝加好友偷能量挖 回复weixin_40871771: https://www.cnblogs.com/online-link/p/6143114.html
一年多之前 回复
weixin_40871771
weixin_40871771 回复showbo: 怎么带?比如。。。?可以具体些不??
一年多之前 回复
showbo
支付宝加好友偷能量挖 回复weixin_40871771: 是的,发送请求里面的cookie都附带上
一年多之前 回复
weixin_40871771
weixin_40871771 不获取别人的,就获取自己的,浏览器发送请求时附带的cookie要怎么看呢?是header头里的cookie??
一年多之前 回复
caozhy
贵阳老马马善福专业维修游泳池堵漏防水工程 没错,如果淘宝能让一个新手那么容易破解,淘宝我看得羞死。淘宝毕竟不同于csdn。
一年多之前 回复

EditThisCookie是一款可以管理Chrome浏览器中cookies的插件,用户可以利用EditThisCookie添加,删除,编辑,搜索,锁定和屏蔽cookies。

我们手动登陆医脉通后,利用 EditThisCookie 导出 cookie,并将其保存到一个txt文件中
这里写图片描述

这时cookie已被我们成功获取
下一步将cookie附入我们每次的请求,如下代码所示

cookie_jar = cookielib.MozillaCookieJar()
cookies = open('cookie.txt').read()
for cookie in json.loads(cookies):
cookie_jar.set_cookie(cookielib.Cookie(version=0, name=cookie['name'], value=cookie['value'], port=None, port_specified=False, domain=cookie['domain'], domain_specified=False, domain_initial_dot=False, path=cookie['path'], path_specified=True, secure=cookie['secure'], expires=None, discard=True, comment=None, comment_url=None, rest={'HttpOnly': None}, rfc2109=False))

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie_jar),urllib2.HTTPHandler)
urllib2.install_opener(opener)
1
2
3
4
5
6
7
现在我们已经将cokie放入urllib2包中了,以后每次访问的时候cookielib都会帮我们自动管理cookie,不需要我们操心啦!!

爬虫

其实cookie不用我们管后,爬虫就是很普通的urllib2的爬虫了,没有什么特别的。

代码

-*- coding: utf-8 -*-

import json
import urllib2
import cookielib

from pyquery import PyQuery as pq

class YMT(object):

def __init__(self):
    """
    读取从 EditThisCookie 上获取的cookie
    并将其绑定到 urllib2 上
    以后每次爬虫访问网站时都会自动带上cookie,不再需要人工参与
    """

    cookie_jar = cookielib.MozillaCookieJar()
    cookies = open('cookie.txt').read()
    for cookie in json.loads(cookies):
        cookie_jar.set_cookie(cookielib.Cookie(version=0, name=cookie['name'], value=cookie['value'], port=None, port_specified=False, domain=cookie['domain'], domain_specified=False, domain_initial_dot=False, path=cookie['path'], path_specified=True, secure=cookie['secure'], expires=None, discard=True, comment=None, comment_url=None, rest={'HttpOnly': None}, rfc2109=False))

    opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie_jar),urllib2.HTTPHandler)
    urllib2.install_opener(opener)

def _get(self, url):
    """
    :param url: 需要访问的url
    :return:    返回该url的网页内容
    """

    request = urllib2.Request(url=url)
    request.add_header('Referer', 'http://meddic.medlive.cn/search/search.do')
    response = urllib2.urlopen(request)
    data = response.read()
    return data

def get_word_translate(self,word):
    """
    :param word: 需要翻译的英文单词
    :return: 如果有对应英文的中文,则返回该中文翻译,否则返回None
    """

    url = 'http://meddic.medlive.cn/search/search.do?word=%s' % word.replace(' ','+')
    html = self._get(url)

    # 用 pyquery 定位翻译
    q = pq(html)
    paraphrase_list = q('.paraphrase_list')

    for paraphrase in paraphrase_list:
        p = pq(paraphrase)

        if p('.dictionary').text() == '英汉医学短语词典':
            return p('.dictionary_message').text()

    return None

if name == '__main__':
ymt = YMT()
word = 'Whipple disease'
print ymt.get_word_translate(word)

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!