#-*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver import ChromeOptions
import os
import json
import time
#导入避免被发现是selenium的工具
def browser_initial():
option = ChromeOptions()
option.add_experimental_option('excludeSwitches', ['enable-automation'])
browser = webdriver.Chrome(executable_path='../chromedriver.exe',options=option)
goal_url = 'https://www.zhihu.com/'
#未携带Cookies
browser.get('https://www.zhihu.com/')
return goal_url, browser
def log_ZHIHU(browser,goal_url):
# 从本地读取cookies
with open('ZhiHu_cookies.txt', 'r', encoding='utf8') as f:
listCookies = json.loads(f.read())
for cookie in listCookies:
cookie_dict = {
'domain': '.zhihu.com',
'name': cookie.get('name'),
'value': cookie.get('value'),
'path': '/',
'httpOnly': False,
'secure': False
}
browser.add_cookie(cookie_dict)
browser.maximize_window()
#测试用搜索
time.sleep(10)
browser.get(url='https://www.zhihu.com/search?q=python%E4%BB%A3%E7%90%86ip&utm_content=search_suggestion&type=content')
return browser
def Seracr(browser):
Seracr_Input=browser.find_element_by_class_name('Input')
Text=input("输入你想搜索的文章的内容")
Seracr_Input.send_keys(Text)
Seracr_Button=browser.find_element_by_class_name('Button')
Seracr_Button.click()
if __name__ == '__main__':
tur = browser_initial()
bro=log_ZHIHU(tur[1],tur[0])
#Seracr(bro)
python 爬虫 登录知乎后搜索 某些文章 遇到的问题 代码补充
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
4条回答 默认 最新
- 澈丹丶 2021-03-30 11:37关注
你打开浏览器的控制台看下页面是不是有问题。而且这个页面的内容,并不是一次性请求过来的。你需要的内容,应该是https://www.zhihu.com/api/v4/search_v3?t=general&q=python%E4%BB%A3%E7%90%86ip&correction=1&offset=0&limit=20&lc_idx=0&show_all_topics=0 这个接口回来的数据,所以其实并不需要selenium,直接去模拟http get请求这个地址就可以了。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥170 如图所示配置eNSP
- ¥20 docker里部署springboot项目,访问不到扬声器
- ¥15 netty整合springboot之后自动重连失效
- ¥15 悬赏!微信开发者工具报错,求帮改
- ¥20 wireshark抓不到vlan
- ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
- ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
- ¥15 stata安慰剂检验作图但是真实值不出现在图上
- ¥15 c程序不知道为什么得不到结果
- ¥15 键盘指令混乱情况下的启动盘系统重装