#-*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver import ChromeOptions
import os
import json
import time
#导入避免被发现是selenium的工具
def browser_initial():
option = ChromeOptions()
option.add_experimental_option('excludeSwitches', ['enable-automation'])
browser = webdriver.Chrome(executable_path='../chromedriver.exe',options=option)
goal_url = 'https://www.zhihu.com/'
#未携带Cookies
browser.get('https://www.zhihu.com/')
return goal_url, browser
def log_ZHIHU(browser,goal_url):
# 从本地读取cookies
with open('ZhiHu_cookies.txt', 'r', encoding='utf8') as f:
listCookies = json.loads(f.read())
for cookie in listCookies:
cookie_dict = {
'domain': '.zhihu.com',
'name': cookie.get('name'),
'value': cookie.get('value'),
'path': '/',
'httpOnly': False,
'secure': False
}
browser.add_cookie(cookie_dict)
browser.maximize_window()
#测试用搜索
time.sleep(10)
browser.get(url='https://www.zhihu.com/search?q=python%E4%BB%A3%E7%90%86ip&utm_content=search_suggestion&type=content')
return browser
def Seracr(browser):
Seracr_Input=browser.find_element_by_class_name('Input')
Text=input("输入你想搜索的文章的内容")
Seracr_Input.send_keys(Text)
Seracr_Button=browser.find_element_by_class_name('Button')
Seracr_Button.click()
if __name__ == '__main__':
tur = browser_initial()
bro=log_ZHIHU(tur[1],tur[0])
#Seracr(bro)
python 爬虫 登录知乎后搜索 某些文章 遇到的问题 代码补充
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
4条回答 默认 最新
- 澈丹丶 2021-03-30 11:37关注
你打开浏览器的控制台看下页面是不是有问题。而且这个页面的内容,并不是一次性请求过来的。你需要的内容,应该是https://www.zhihu.com/api/v4/search_v3?t=general&q=python%E4%BB%A3%E7%90%86ip&correction=1&offset=0&limit=20&lc_idx=0&show_all_topics=0 这个接口回来的数据,所以其实并不需要selenium,直接去模拟http get请求这个地址就可以了。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 C#算法问题, 不知道怎么处理这个数据的转换
- ¥15 YoloV5 第三方库的版本对照问题
- ¥15 请完成下列相关问题!
- ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
- ¥15 求daily translation(DT)偏差订正方法的代码
- ¥15 js调用html页面需要隐藏某个按钮
- ¥15 ads仿真结果在圆图上是怎么读数的
- ¥20 Cotex M3的调试和程序执行方式是什么样的?
- ¥20 java项目连接sqlserver时报ssl相关错误
- ¥15 一道python难题3