pyodbc和pymssql同步数据怎么循环插入新数据,重复数据跳过

**怎么python实现读SQL Server表的数据插入MySQL,存在数据跳过呢,初学者,只会清空表格,全部重新插入,怎么将新的插入 **

import pyodbc
import pymysql
from datetime import datetime
import time

# SQL Server数据库连接配置信息
server = '127.0.0.1'
database = 'Dianhan'
username = 'sa'
password = '123456'

while True:
    try:
        # 建立与SQL Server数据库的连接，修正驱动部分
        conn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=' + server + ';DATABASE=' + database + ';UID=' + username + ';PWD=' + password)

        # 连接MySQL数据库
        conn2 = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='test', port=3306)

        # 获取SQL Server表的列名
        sql_server_cursor = conn.cursor()
        column_names_query = "SELECT COLUMN_NAME FROM INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME ='weldmeasureprot_t'"
        sql_server_cursor.execute(column_names_query)
        column_names = [row[0] for row in sql_server_cursor.fetchall()]

        # 查询SQL Server表的所有数据
        sql_server_data_query = "SELECT * FROM Weldmeasureprot_T"
        sql_server_cursor.execute(sql_server_data_query)
        sql_server_data = sql_server_cursor.fetchall()

        # 构建插入到MySQL表的SQL语句，使用正确的表名
        placeholders = ', '.join(['%s'] * len(column_names))
        if not column_names:
            print("未能获取到有效的列名列表，请检查相关查询或数据库连接。")
            raise ValueError("列名列表为空，无法继续构建插入语句。")
        insert_query = "INSERT INTO weldMeasureProt_t ({}) VALUES ({})".format(', '.join(column_names), placeholders)
        # insert_query = "INSERT INTO weldMeasureProt_t ({}) VALUES ({})".format(', '.join(column_names), '%s')
        # placeholders = [''] * len(column_names)
        # 获取MySQL插入操作的游标
        mysql_cursor = conn2.cursor()
        # 插入前清空表
        mysql_cursor.execute("TRUNCATE TABLE weldMeasureProt_t ")
        # 遍历插入数据到MySQL表
        for row in sql_server_data:
            values = []
            for i, column in enumerate(column_names):
                values.append(row[i])
            mysql_cursor.execute(insert_query, tuple(values))  # values传入元祖
            print(values)
        print()
        # 提交MySQL插入操作，使数据生效
        conn2.commit()

        print("数据从SQL Server成功迁移到MySQL。%s"%datetime.now().strftime('%Y-%m-%d %H:%M:%S'))

    except pyodbc.Error as e:
        print(f"连接或操作SQL Server数据库时出错: {e}")
    except pymysql.Error as e:
        print(f"连接或操作MySQL数据库时出错: {e}")
    finally:
        # 关闭SQL Server游标和连接
        if 'sql_server_cursor' in locals():
            sql_server_cursor.close()
        if 'conn' in locals():
            conn.close()

        # 关闭MySQL游标和连接
        if 'mysql_cursor' in locals():
            mysql_cursor.close()
        if 'conn2' in locals():
            conn2.close()

    time.sleep(10)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
恐怖如斯恐怖如斯啊 2024-11-16 13:33
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

从您的描述和代码来看，您正在尝试将SQL Server中的表数据同步到MySQL，同时希望在插入数据时跳过重复的记录。这可以通过在MySQL中使用主键或唯一索引来实现，或者在插入前检查数据是否已存在。以下是修改后的代码示例，以跳过重复数据：

首先，确保MySQL表中有一个可以用于检查重复数据的字段，例如主键或具有唯一约束的字段。如果没有这样的字段，可能需要创建一个。然后，您可以使用以下步骤来插入数据并跳过重复项：

从SQL Server获取数据。
在插入到MySQL之前，检查数据是否已经存在。
如果数据不存在，则插入到MySQL中。

以下是修改后的代码示例：

import pyodbc import pymysql from datetime import datetime import time # 数据库连接配置信息保持不变... # 主循环不变... while True: try: # 建立SQL Server数据库连接不变... # 连接MySQL数据库不变... # 获取SQL Server表的列名不变... # 查询SQL Server表的所有数据不变... # 构建插入到MySQL表的SQL语句（假设存在一个唯一标识字段unique_id） insert_query = "INSERT IGNORE INTO weldMeasureProt_t (unique_id, ...) VALUES (%s, ...)" # 使用IGNORE关键字跳过重复数据插入错误 # 获取MySQL插入操作的游标不变... # 遍历插入数据到MySQL表（增加检查数据是否已存在的逻辑） for row in sql_server_data: unique_value = row[unique_id_index] # 获取唯一标识字段的值（假设unique_id是列索引） # 检查数据是否已经存在于MySQL表中（这里使用唯一标识字段作为检查条件） check_query = "SELECT COUNT(*) FROM weldMeasureProt_t WHERE unique_id = %s" # 使用唯一标识字段作为条件查询是否已经存在记录 mysql_cursor.execute(check_query, (unique_value,)) # 执行查询检查是否存在记录 if mysql_cursor.fetchone()[0] == 0: # 如果返回的记录数为0，表示不存在记录，则进行插入操作 mysql_cursor.execute(insert_query, tuple(values)) # values为从SQL Server获取的数据组成的元组（去掉唯一标识字段） print("数据同步完成。") # 或其他提示信息 # 提交MySQL插入操作不变... except Exception as e: # 使用更广泛的异常捕获以便于调试和日志记录 print(f"发生错误: {e}") # 输出错误信息或其他日志记录方式 finally: # 关闭数据库连接和游标的逻辑不变... time.sleep(10) # 休眠一段时间后再进行下一次同步（可选）

请注意以下几点：

unique_id 是假设的用于检查重复数据的字段索引或名称。您需要替换为实际的唯一标识字段。如果没有这样的字段，则需要确定一种方法来检查重复的数据行。如果数据是唯一的并且没有主键或唯一索引字段，则可能需要检查整个行数据是否已存在。这会增加检查的复杂性并可能影响性能。在这种情况下，可能需要考虑其他策略来避免重复数据的插入问题。另外，“INSERT IGNORE INTO”命令可以帮助忽略因重复键引发的错误并继续执行插入操作。这对于确保只插入新记录非常有用。但是，请注意使用它时要小心，因为它也会忽略其他类型的错误（例如违反约束的错误）。因此在使用前确保理解其含义和行为。如果您想更精确地控制哪些错误被忽略，可能需要使用其他方法来进行检查和插入操作。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python实现读取SQLServer数据并插入到MongoDB数据库的方法示例
2020-09-09 09:40

在本示例中，我们将探讨如何使用Python编程语言来实现从SQL Server数据库中读取数据，并将这些数据插入到MongoDB数据库中。首先，我们需要了解Python中与这两个数据库交互的相关库：`pyodbc`用于连接和操作SQL ...
采集和分析沪深股票财务数据.zip
2024-01-04 03:09

2. **Python编程**：Python是数据分析的首选语言，因为其丰富的库如`pandas`，`requests`，`beautifulsoup4`等，使得数据处理和网络爬虫变得简单。在这个项目中，Python源码可能用于构建数据采集脚本和分析工具。 3...
定时百度统计获取基础概况数据
2023-12-15 19:42

在IT行业中，定时获取数据是一项常见的任务，尤其在数据分析和监控场景下。本文将深入探讨如何使用`.NET Core`框架，结合`SQLServer`数据库和`requests`库，实现定时从百度统计接口获取基础概况数据。首先，我们...
通达信期货数据转csv
2021-10-13 16:15

在量化交易领域，将期货数据存储为CSV文件，可以方便地导入到Python、R等编程语言中进行进一步的统计分析和策略回测。转换过程通常包括以下步骤： 1. 数据获取：在通达信软件中，你可以查看并导出期货合约的历史...
数据库数据传给Word.rar_word_数据_数据库 word
2022-09-20 13:32

这通常涉及到编程接口（APIs）的使用，例如Microsoft Office的自动化功能或通过编程语言如Python、VBA（Visual Basic for Applications）来实现数据的转换和传输。首先，我们来看“www.pudn.com.txt”这个文件，它...
基于Python的SQL Server海量数据转移的研究与实现.pdf
2021-06-29 13:33

Python作为一种高级编程语言，在数据库操作方面提供了丰富库的支持，如pyodbc、pymssql等。Python与SQL Server的结合可以利用Python强大的数据处理能力和SQL Server的事务处理能力。Python不仅能够执行复杂的数据...
syscomp.rar_python界面数据
2022-09-14 21:46

标题“syscomp.rar_python界面数据”暗示我们正在处理一个与Python相关的项目，它涉及软件界面和数据表的比较。这个小工具可能被设计用来帮助开发者或数据库管理员快速检测和定位数据逻辑的变化。从描述中我们可以...
配置ODBC数据源.7z
2022-07-06 13:54

6. **在应用程序中使用ODBC数据源**：在编程环境中（如Python、C++或VB），通过编程方式指定配置好的ODBC数据源名称，即可实现数据库连接。例如，在Python中使用`pyodbc`库： ```python import pyodbc conn = ...
DSN.rar_DSN_dsn lift_配置数据源
2022-09-19 14:26

源码可能使用了ODBC API或者相关的数据库连接库，如Python的pyodbc，Java的JDBC等，来动态创建和管理DSN。 “www.pudn.com.txt”可能是该资源的来源说明或者附加文档，可能包含更多关于这个程序源码的使用和实现...
pyodbc pymssql访问 ms sqlserver
2024-06-01 08:04

马红权的博客 pymssql对比pyodbc优点是不需安装驱动，而微软的驱动在旧版本系统上安装不上，这时pymssql就可派上用场。用pymssql遇到的一个问题是varchar类型字段中保存中文时乱码，要用nvarchar类型。pyodbc就没遇到这个问题。...
fp.rar_python_python 数据库_python读取数据_文件_读取文件
2022-09-21 07:25

在Python编程语言中，文件操作是一项基础且至关重要的技能，特别是在处理数据时。"fp.rar"这个文件可能是一个压缩包，里面包含了与Python文件操作、数据库连接以及数据读取相关的资源。在这里，我们将深入探讨这些...
data_gener_import.py.tar.gz_data-import_数据模拟
2022-09-23 18:13

这种文件格式简单且易于读取，可以被多种编程语言和数据处理工具支持。Pandas库中的`to_csv()`函数可以方便地将数据框（DataFrame）对象写入CSV文件。 3. **数据导入（Data Import）**：生成的CSV文件随后会被导入...
解决python 未发现数据源名称并且未指定默认驱动程序的问题
2021-01-20 04:56

最近在用python连接sqlserver读取数据库，读取数据时候在本机电脑正常，但是把程序部署到服务器运行时一直报错“未发现数据源名称并且未指定默认驱动程序”，后来发现是因为数据源的问题，解决如下：驱动用的是 ...
用 pymssql 库和pyodbc 库和pywin32 库的 ADO 功能三种方式访问SQL Server 并对数据库进行操作
2022-12-12 21:04

在这里用界面得形式进行展示，首先展示用 pymssql 库和pyodbc 库和pywin32 库的 ADO 功能三种方式访问的按钮，然后进入查询窗口对输入框分别输入相应需要查询得参数，最终得到相应的输出结果，结果分别展示在设定的...
python数据库编程：Python连接Mssql基础教程之Python库pymssql.pdf
2023-06-12 11:15

插入数据可以使用`cursor.execute()`方法配合`executemany()`来批量插入数据。确保在操作完成后调用`commit()`方法提交事务，否则更改不会保存到数据库。 ```python cursor.execute(""" CREATE TABLE IF NOT ...
完整版读取DBF数据.rar
2020-04-03 05:13

1. **API和库**：多种编程语言提供了用于读取DBF文件的库或API。例如，Python有`pyodbc`、`pandas`、`dbfread`等库，Java可以使用JDBC与JDBC-ODBC桥接，C#有`SharpDBF`，而PHP有`dbase`函数库等。选择哪种库通常取决...
用于ETL的Python数据转换工具详解
2020-09-16 11:50

Python作为一种灵活且强大的编程语言，已经成为ETL工作流中的常见选择。Python的数据转换工具有助于简化和加速数据处理任务，尤其是对于那些对性能和可扩展性有要求的项目。 1. Pandas：Pandas是Python中最流行的...
电力数据分析课题报告.zip
2020-10-09 20:01

Python提供了如SQLAlchemy、pyodbc等库，便于进行数据的导入和导出，便于数据管理和长期存储。 7. **实验报告**：最后，整理成实验报告是科学研究的标准流程，报告应包含方法介绍、结果展示、分析讨论和结论部分，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 1月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月16日

pyodbc和pymssql同步数据怎么循环插入新数据,重复数据跳过

1条回答 默认 最新

问题事件

1条回答默认最新