如何将python爬取下来的数据保存到Mysql


import requests
from lxml import etree
import pymysql
import re
headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36 Edg/91.0.864.59',
    }
url='https://www.gushiwen.cn/default_2.aspx'

def get_ancient_poetry():
   
    response=requests.get(url,headers=headers)
    content = response.content.decode('utf8')
    html = etree.HTML(content)
    titles=html.xpath('//div[@class="cont"]/p/a/b/text()')  #古诗名
    authors=html.xpath('//p[@class="source"]/a/text()') #作者
    dynastys=html.xpath('//p[@class="source"]/a/text()')  #朝代
    content=html.xpath('//div[@class="contson"]/text()') #古诗内容
    content=''.join(html.xpath('//div[@class="contson"]/text()')).strip()
    pomes = []
    print(content)
  




if __name__ == '__main__':
    get_ancient_poetry()

这里我打印content返回是正常的古诗内容

import requests
from lxml import etree
import pymysql
import re
headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36 Edg/91.0.864.59',
    }
url='https://www.gushiwen.cn/default_2.aspx'

def get_ancient_poetry():
    conn = pymysql.connect(host='localhost', user='root', password='123456', database='boss', port=3306)

    cursor = conn.cursor()
    response=requests.get(url,headers=headers)
    content = response.content.decode('utf8')
    html = etree.HTML(content)
    titles=html.xpath('//div[@class="cont"]/p/a/b/text()')  #古诗名
    authors=html.xpath('//p[@class="source"]/a/text()') #作者
    dynastys=html.xpath('//p[@class="source"]/a/text()')  #朝代
    content=html.xpath('//div[@class="contson"]/text()') #古诗内容
    content=''.join(html.xpath('//div[@class="contson"]/text()')).strip()
    pomes = []
    for value in zip(titles, authors, dynastys, content):
        title, author, dynasty, content = value
        pome = {
            '古诗名': title,
            '作者': author,
            '朝代': dynasty,
            '古诗内容': content
        }
        pomes.append(pome)
    for pome in pomes:
        print(pome)
        print('=' * 40)




if __name__ == '__main__':
    get_ancient_poetry()

这样子写之后在打印发现古诗内容就获取了一个字这是为啥该怎么修改代码

而且我还想保存到mysql数据库里面，表已经建好了但是不会能帮忙完善一下代码讲解一下吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-10-21 17:27
关注
根据后面处理数据的要求，content是一个列表，将第21行改成如下即可：
content=[c.strip() for c in content]
至于mysql在连接后，使用create table,insert into等语句将数据写入，参考sql及pymysql使用教程。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

如何将python爬取下来的数据保存到Mysql mysql python 有问必答
2021-10-21 16:59

回答 2 已采纳根据后面处理数据的要求，content是一个列表，将第21行改成如下即可：content=[c.strip() for c in content]至于mysql在连接后，使用create table,
python以下爬取的怎么保存mysql mysql python
2022-06-23 00:42

回答 2 已采纳首先你得有一个MySQL数据库，可以是在服务器上，也可以是在你电脑本地，下面以Windows电脑本地MySQL举例。（1）下载MySQL。去MySQL官网下载MySQL安装包；（2）安装MySQL。安
为什么python爬虫的结果存储不到MySQL中？ mysql python
2022-06-21 19:56

回答 2 已采纳可能你根本没爬取到
python爬取招聘数据保存到mysql数据库
2023-07-20 16:05

5. **数据库连接与数据插入**：在Python中，我们需要建立与MySQL服务器的连接，创建游标对象，然后执行SQL语句将数据逐条插入到相应的表中。需要注意的是，为了防止数据丢失，应当确保在成功插入后提交事务，如果...
如何把request爬取的数据弄到SQL server数据库里面(语言-python) python sqlserver
2022-04-18 10:01

回答 2 已采纳 1、清洗你爬取的数据，使其符合数据库中表对数据的规则要求；2、 import pymssql3、连接你的数据库，执行写入，如下：
python读取BLOB格式数据 mysql python
2020-10-10 17:12

回答 1 已采纳调试下看看gzip.decompress(content)是什么，是不是合法的utf-8字符串
PYTHON向mysql数据库写入数据失败，查询、删除和修改都可以，但是就是无法写入 mysql python
2022-06-21 00:44

回答 2 已采纳你写错引号了sql里的字符串需要用单引号包裹，而不是双引号所以你的str最外层应该用双引号定义，而里面的字段用单引号就是把单引号和双引号对调一下
Python爬取数据并写入MySQL数据库的实例
2020-09-09 09:15

在本实例中，我们将探讨如何使用Python编程语言从网页抓取数据并将其存储到MySQL数据库中。这个过程涉及两个主要部分：数据爬取和数据库操作。 1. **数据爬取**：数据爬取通常使用Python中的第三方库，如...
对于股市主板A股使用python爬取前100条数据 python 有问必答
2021-06-23 15:19

回答 1 已采纳每次翻页的时候，url都有变化规律，如第二页http://quote.cfi.cn/quoteList.aspx?sortcol=stockcodesortwayasc&sortway=asc&pag
python爬虫爬取数据存储进数据库的问题 flask mysql python
2019-04-22 20:43

回答 3 已采纳首先，我建议你主键最好不要设在userId上。让ID自增长。然后把userId作为一个普通的字段。其次，我个人建议也不要设置外键关系。你可以通过把某一张表的ID放到另一张表里作为关联，但是不建议设
怎么解决mysql将爬取的数据存入了两次 mysql python
2021-07-29 17:17

回答 1 已采纳入库前做处理。找到唯一标识，进行去重判断。可以用原生mysql的查询结果做判断，也可以用redis做去重队列
一篇文章让你轻松学会python爬取的数据保存到MySQL中,有案例哦
2022-08-17 18:19

Transcend oneself的博客一篇文章让你轻松学会python爬取的数据保存到MySQL中,有案例哦,还有pymysql详细用法解析
爬取html入mysql插入失败 html5 mysql python
2022-06-02 13:59

回答 2 已采纳你的插入的value值和数据库表的数据格式不一致吧，你的value好像有好几个值，但是插入的数据库对应的只有三个。格式不对，所有插入数据不行
Python爬取豆瓣250数据保存到MySQL或者excel代码
2021-03-20 21:30

import xlwt import pymysql
Python爬取小说并存入到mysql数据库源代码
2022-12-26 10:28

本项目将向你展示如何使用Python编写一个网络爬虫，以获取在线小说的内容，并将其存储到MySQL数据库中。首先，我们需要安装必要的库，如requests用于发送HTTP请求，BeautifulSoup用于解析HTML文档，以及pymysql用于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月21日

悬赏问题

¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵
¥15 cfx离心泵非稳态计算

如何将python爬取下来的数据保存到Mysql

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新