python连接mysql数据库不需要输入哪个参数
A.port
B.user
C.host
D.password
. 以下哪个selenium命令是错的(driver=webdriver.Chrome())
A.driver.get_cookies()
B.drlver.find_element(s)_by_ld()
C.driver.get(url)
D.driver.page_source
POST请求不需要在请求参数中添加哪个参数?
A.data
B.请求头
C.url
D.params
. 获取时间戳需要用到哪个模块
A.time
B.data
C.datatime
D.sleep
14. 在python中md5加密查看数据的方法是哪一个?
A.cryptographic
B.hexdigest
C.encode
D.content
15. ubuntu环境下,在线安装软件包的命令是?
A.pip install
B.yum install
C.apt-get install
D.wget
16. 哪种类型的数据属于结构化数据?
A.XML
B.HTML
C.办公文档
D.图像
以下为多选题
请在右侧面板添加段落说明信息
- 当前使用的python3.7以上版本哪些第三方库可以用于爬虫的相关操作?
A.requests
B.Urllib
C.selenium
D.scrapy
18. 爬虫常用的数据提取方法有哪些
A.xpath
B.正则
C.jsonpath
D.jscnpath
19. 常见的反爬措施有哪些?
A.检查user-agent
B.封ip
C.限制访问频率
D.验证码
20. 请求头数据包括哪些?
A.User-Agent
B.Accept
C.Referer
D.Content-Type
21. 以下json数据转化方式中哪几个使用方式是正确的?
A.json.dump
B.json.load
C.jscn.dumps
D.jsons.loads
22. 以下哪些获取数据的行为不推荐?
A.大量占用爬取网络资源
B.违背网站的爬取设置
C.获取加密级别极高的保密信息
D.入侵服务器造成服务器崩溃死机
23. HTTP和HTTPS的区别在哪儿?
A.url不同
B.标准端口不同
C.全称不同
D.信息传递方式不同
24. 根据爬虫的类型可以分为哪几种爬虫
A.索引爬虫
B.通用爬虫
C.聚焦爬虫
D.专精爬虫
25. 数据的写入方式包括哪些?
A.wb
B.r-
C.a+
D.w+.
26. selenium对谷歌浏览器进行操作前需要进行哪些准备工作?
A.确定待请求的网络链接,如: https://www.baidu.com/
B.下载对应的驱动: chromedriver.exe
C.导入类/方法:from selenium as webdrivers
D.下载第三方库:plp install selenium