为什么爬取CSDN热搜存MySQL为空？如何解决


import requests
import pymysql
from lxml import etree

conn = pymysql.connect(host='127.0.0.1', user='root', password='*****', port=3306, database='热搜爬取')

cursor = conn.cursor()


headers={
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.67"
}
url = 'https://blog.csdn.net/rank/list'

reponse = requests.get(url, headers=headers)   # reponse
reponse.encoding = 'utf-8'
html = etree.HTML(reponse.text)

title = html.xpath('//div[@class="hosetitem-title"]/a/text()')
url1 =html.xpath('//div[@class="hosetitem-title"]/a/@href')


for n in range(len(title)):
    print(url1[n])
    sql = "insert into CSDN(排行,标题,网址) values('%d','%s','%s')"%(n+1,title[n],url1[n])
    #print(title[n])
    #print(url[n])
    cursor.execute(sql)
    conn.commit()

cursor.close()
# 关闭连接
conn.close()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
python收藏家 2021-08-12 16:14
关注
没有报错？还是爬取的结果为空？或者数据库表存在？字段类型对应？首先看是爬取问题还是数据库存储问题

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫，实现爬取CSDN文章，并保存到本地为MarkDown 格式
2023-11-22 17:32

Python爬虫，实现爬取CSDN文章，并保存到本地为MarkDown 格式，也能够直接保存到 Mysql 数据库中，涉及到 py_mysql、BeautifulSoup、requests、html2text、parsel、etree、unescape 实现
python爬虫爬取csdn文章内容存储为excel文件，后续添加在mysql数据库中.zip
2024-03-29 15:28

本项目“python爬虫爬取csdn文章内容存储为excel文件，后续添加在mysql数据库中”旨在展示如何利用Python来爬取知名IT社区CSDN上的文章内容，并将这些数据整理存入Excel文件，最终进一步导入到MySQL数据库中，以实现...
python爬取微博热搜写入数据库_python实现爬取微博热搜存入Mysql
2021-01-29 23:53

weixin_39716105的博客 python爬取微博热搜存入Mysql最终的效果使用的库目标分析一：得到数据二：链接数据库总代码最终的效果废话不多少，直接上图这里可以清楚的看到，数据库里包含了日期，内容，和网站link下面我们来分析怎么实现使用的...
Python爬取今日头条热门文章
2024-01-10 08:41

Python脚本文件，使用Python爬取今日头条指定专栏分类的热门文章，并将文章保存到MySQL数据库中实现今日头条热门文章数据爬取
利用python3爬虫爬取全国天气数据并保存入Mysql数据库
2018-08-07 22:11

利用python3爬虫爬取全国天气数据并保存入Mysql数据库具体可见博客 https://blog.csdn.net/u013523775/article/details/79313803
python爬取热搜制作词云
2021-12-21 11:49

Dead_Cicle的博客环境：win10,64位，mysql5.7数据库，...1、爬取热搜，首先拿到url,使用的包urllib,有教程说urllib2是python2的。 '''读取页面''' def readhtml(self,catchUrl): catchUrl=self.catchUrl if not catchUrl else cat
python 爬取 CSDN账号文章标题、链接并存入mysql数据库
2021-02-01 15:01

罗四强的博客 3、python链接mysql数据库 4、爬取文章标题、链接插入mysql数据库 5、获取到结果如下 1、创建mysql数据库 py_crawler 2、创建存储链接的表 DROP TABLE IF EXISTS `wz_ad_links`; CREATE TABLE `wz_ad_...
python爬取数码产品信息使用mysql，requests，BeautifulSoup等包
2023-05-06 18:08

爬取网站：http://www.manmanbuy.com/ 使用mysql，requests，BeautifulSoup等包，获取数据后并入库
基于Python的必联网招标信息爬取系统.zip
2023-11-17 09:47

基于Python的必联网招标信息爬取系统.zip使用scrapy爬取必联网招标信息，使用代理IP池，并存入mysql数据库中; 信息存储字段： projectcode = '', # 项目编号 web = '', # 信息来源网站 keyword = '', # 关键字 ...
Python3爬取CSDN博客信息1.0（基础版-附完整代码）
2020-12-10 19:28

迟到_啦的博客参考完整代码可直接跳转到第五步文章目录一、爬取目标二、使用技术三、需求分析1、查看网页源代码2、源代码拷贝到VSCode3、全局搜索关键字，找到代码位置4、观察代码规律四、功能划分五、代码实现1...python3 urll.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月12日

为什么爬取CSDN热搜存MySQL为空？如何解决

1条回答 默认 最新

问题事件

1条回答默认最新