python 爬虫登录知乎后搜索某些文章遇到的问题代码补充

#-*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver import ChromeOptions
import os
import json
import time
#导入避免被发现是selenium的工具


def browser_initial():
    option = ChromeOptions()
    option.add_experimental_option('excludeSwitches', ['enable-automation'])
    browser = webdriver.Chrome(executable_path='../chromedriver.exe',options=option)

    goal_url = 'https://www.zhihu.com/'
    #未携带Cookies
    browser.get('https://www.zhihu.com/')
    return goal_url, browser


def log_ZHIHU(browser,goal_url):
# 从本地读取cookies
    with open('ZhiHu_cookies.txt', 'r', encoding='utf8') as f:
        listCookies = json.loads(f.read())
    for cookie in listCookies:
        cookie_dict = {
            'domain': '.zhihu.com',
            'name': cookie.get('name'),
            'value': cookie.get('value'),
            'path': '/',
            'httpOnly': False,
            'secure': False
        }

        browser.add_cookie(cookie_dict)
    browser.maximize_window()
    #测试用搜索
    time.sleep(10)
    browser.get(url='https://www.zhihu.com/search?q=python%E4%BB%A3%E7%90%86ip&utm_content=search_suggestion&type=content')
    return browser
def Seracr(browser):
    Seracr_Input=browser.find_element_by_class_name('Input')
    Text=input("输入你想搜索的文章的内容")
    Seracr_Input.send_keys(Text)
    Seracr_Button=browser.find_element_by_class_name('Button')
    Seracr_Button.click()

if __name__ == '__main__':
    tur = browser_initial()
    bro=log_ZHIHU(tur[1],tur[0])
    #Seracr(bro)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
澈丹丶 2021-03-30 11:37
关注
你打开浏览器的控制台看下页面是不是有问题。而且这个页面的内容，并不是一次性请求过来的。你需要的内容，应该是https://www.zhihu.com/api/v4/search_v3?t=general&q=python%E4%BB%A3%E7%90%86ip&correction=1&offset=0&limit=20&lc_idx=0&show_all_topics=0 这个接口回来的数据，所以其实并不需要selenium，直接去模拟http get请求这个地址就可以了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

python 爬虫登录知乎后搜索某些文章遇到的问题代码补充 python
2021-03-29 11:59

回答 4 已采纳你打开浏览器的控制台看下页面是不是有问题。而且这个页面的内容，并不是一次性请求过来的。你需要的内容，应该是https://www.zhihu.com/api/v4/search_v3?t=genera
python 爬虫登录知乎后搜索某些文章遇到的问题 python
2021-03-29 09:24

回答 2 已采纳访问频率别太快，加个延时试试。。。如果偶尔成功，偶尔出问题的话，那试试retry
python 爬虫驱动知乎微信登录点击不了 python selenium 爬虫
2022-02-12 16:41

回答 2 已采纳你对象错了，driver.get(url) 没有返回值，直接用driver就好了 # driver = webdriver.Edge(driver_path) # url = xxx
python爬虫模拟知乎登录.zip
2024-01-01 23:42

这个分享包涵了我开发的Python爬虫工具项目，主要用于合法爬取某些网页信息。以下是主要内容：源代码：包括Python代码和相关脚本。这些代码展示了如何使用Python进行网页抓取、解析和数据提取。项目文件：除了...
python 爬虫还是关于知乎的问题 python
2021-03-29 19:49

回答 5 已采纳之前解决了问题忘了写答案了，现在补上一下解决思路就是通过使用一个已经打开了的浏览器，来避免知乎发现是使用的selenium模块添加如下代码即可 option = ChromeOp
Python爬知乎热榜出现了Process finished with exit code 0怎么解决 python
2021-07-27 16:53

回答 2 已采纳返回零说明没有错误，通过我的检查发现你的选择返回的是空列表，说明你在匹配内容的时候没有匹配到，重新检查一下就行
python爬虫，为什么使用cookie后会，网页会返回403？ python 有问必答
2021-04-10 20:07

回答 4 已采纳对网站的多次请求时，要模仿浏览器浏览的一样，要有时间间隔不能过于频繁，尽量把请求头写全写对，针对题主的问题，1.csrf_token的获取要从页面分析着手，主要是在页面代码中meta 或其他地方找；二
Python 爬虫模拟登陆知乎
2020-12-25 06:00

在之前写过一篇使用python爬虫爬取电影天堂资源的文章，重点是如何解析页面和提高爬虫的效率。由于电影天堂上的资源获取权限是所有人都一样的，所以不需要进行登录验证操作，写完那篇文章后又花了些时间研究了一下...
Python爬虫、requests库的get方法，带上headers后出现编码错误 python 爬虫
2018-03-25 07:07

回答 4 已采纳头有问题啊！'Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/59.0'不知道怎么会出现...这种符号！自己去复制浏览器的user-ag
爬虫：无法获取到sessionID python 有问必答
2022-05-20 12:09

回答 2 已采纳如果登陆了，会缓存在浏览器端。每次请求接口时会携带这个sessionId，包含在cookies中。
python里requests.get到的数据.json()出错是怎么回事，求解，急！~ python 有问必答爬虫
2021-10-05 00:13

回答 3 已采纳返回的值不符合json规范，先返回文本，打印内容看看，再做处理。
Python爬虫之模拟知乎登录的方法教程
2020-09-21 07:44

在爬虫过程中，有些页面在登录之前是被禁止抓取的，这个时候就需要模拟登陆了，下面这篇文章主要给大家介绍了利用Python爬虫模拟知乎登录的方法教程，文中介绍的非常详细，需要的朋友可以参考借鉴，下面来一起看看吧...
请问新版知乎登陆的cookie值一直报错，没法登陆，该怎么办呀 python 有问必答爬虫
2021-12-22 16:07

回答 2 已采纳代码没问题，cookie过期了，重新登录通过浏览器获取最新cookie就能获取到内容了
Python知乎爬虫代码
2019-07-31 17:07

利用Python网络数据采集技术的爬虫代码demo，可以提供给爬虫初学者参考。
python爬虫知乎代码_python爬虫知乎的简单代码实现
2021-03-06 17:03

Hanlvvisa-黄先生的博客知乎类似于一个论坛，讨论度比百度高一些，那你知道如何用python爬虫爬知乎网站吗？其实如果直接爬取很容报错，我们可以通过浏览器伪装爬取。1、python爬虫工作原理python爬虫通过URL管理器，判断是否有待爬URL，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月3日

悬赏问题

¥170 如图所示配置eNSP
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥15 键盘指令混乱情况下的启动盘系统重装

python 爬虫 登录知乎后搜索 某些文章 遇到的问题 代码补充

4条回答 默认 最新

问题事件

悬赏问题

python 爬虫登录知乎后搜索某些文章遇到的问题代码补充

4条回答默认最新