(1)爬取静态网页:https://movie.douban.com/subject/26743573/的元素。
(2)爬取网页元素以后,清洗出该网页中div标签下span标签的文本内容。
(一)利用python爬虫技术打开动态网页:http://www.xasyu.cn/(5分)
(二)利用python爬虫技术打开动态网页:http://www.xasyu.cn/,
(一)模拟登录1个网页(23分)
模拟登录网址:https://www.baidu.com (10分)
(二)网页爬取信息存储到MYSQL(23分)
模拟登录网址:https://www.baidu.com,且把用户名和密码存储到数据库中。 (23分)
(一)利用scrapy爬虫www.maoyan.com网页中的元素(25分)
有学爬虫的吗?帮帮我
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-