戴帽子的小女孩 2021-10-21 16:59 采纳率: 66.7%
浏览 71
已结题

如何将python爬取下来的数据保存到Mysql


import requests
from lxml import etree
import pymysql
import re
headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36 Edg/91.0.864.59',
    }
url='https://www.gushiwen.cn/default_2.aspx'

def get_ancient_poetry():
   
    response=requests.get(url,headers=headers)
    content = response.content.decode('utf8')
    html = etree.HTML(content)
    titles=html.xpath('//div[@class="cont"]/p/a/b/text()')  #古诗名
    authors=html.xpath('//p[@class="source"]/a/text()') #作者
    dynastys=html.xpath('//p[@class="source"]/a/text()')  #朝代
    content=html.xpath('//div[@class="contson"]/text()') #古诗内容
    content=''.join(html.xpath('//div[@class="contson"]/text()')).strip()
    pomes = []
    print(content)
  




if __name__ == '__main__':
    get_ancient_poetry()

这里我打印content返回是正常的古诗内容

img

import requests
from lxml import etree
import pymysql
import re
headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36 Edg/91.0.864.59',
    }
url='https://www.gushiwen.cn/default_2.aspx'

def get_ancient_poetry():
    conn = pymysql.connect(host='localhost', user='root', password='123456', database='boss', port=3306)

    cursor = conn.cursor()
    response=requests.get(url,headers=headers)
    content = response.content.decode('utf8')
    html = etree.HTML(content)
    titles=html.xpath('//div[@class="cont"]/p/a/b/text()')  #古诗名
    authors=html.xpath('//p[@class="source"]/a/text()') #作者
    dynastys=html.xpath('//p[@class="source"]/a/text()')  #朝代
    content=html.xpath('//div[@class="contson"]/text()') #古诗内容
    content=''.join(html.xpath('//div[@class="contson"]/text()')).strip()
    pomes = []
    for value in zip(titles, authors, dynastys, content):
        title, author, dynasty, content = value
        pome = {
            '古诗名': title,
            '作者': author,
            '朝代': dynasty,
            '古诗内容': content
        }
        pomes.append(pome)
    for pome in pomes:
        print(pome)
        print('=' * 40)




if __name__ == '__main__':
    get_ancient_poetry()

这样子写之后在打印发现古诗内容就获取了一个字这是为啥该怎么修改代码

img

而且我还想保存到mysql数据库里面,表已经建好了但是不会能帮忙完善一下代码讲解一下吗

img

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2021-10-21 17:27
    关注

    根据后面处理数据的要求,content是一个列表,将第21行改成如下即可:
    content=[c.strip() for c in content]
    至于mysql在连接后,使用create table,insert into等语句将数据写入,参考sql及pymysql使用教程。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 10月29日
  • 已采纳回答 10月21日
  • 创建了问题 10月21日

悬赏问题

  • ¥15 升腾威讯云桌面V2.0.0摄像头问题
  • ¥15 关于Python的会计设计
  • ¥15 聚类分析 设计k-均值算法分类器,对一组二维模式向量进行分类。
  • ¥15 stm32c8t6工程,使用hal库
  • ¥100 有偿求易语言word文档取doc和docx页数方法或模块
  • ¥15 找能接spark如图片的,可议价
  • ¥15 关于#单片机#的问题,请各位专家解答!
  • ¥15 博通raid 的写入速度很高也很低
  • ¥15 目标计数模型训练过程中的问题
  • ¥100 Acess连接SQL 数据库后 不能用中文筛选