weixin_43405952 2025-08-04 16:35 采纳率: 81.8%

请教商品查重程序的思路

本人从事零售行业，工作中经常需要为客户配货。在配货过程中客户提出要求，希望每一次配的货都是新品，和之前的货尽不重复。于是尝试写一个程序，用python+sqlite的组合。在程序编码的过程中发现，数据库中商品的条码使用唯一性约束或者主键约束时没达到预想中的效果，数据库通常会比对TEXT类型中每一个字符，只要头一个或两个字符相同，就判定为重复。然而，商品条码往往在字符串第五、六位才开始有差异的。之后又尝试过直接使用数据库查询之后再根据返回值判断是否重复，但逻辑链中变量比较多，出现了比较多意想不到的程序错误。
请问这么一个查重程序比较稳妥的编写思路是怎样的呢？或者是更换其他的数据库？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-08-04 16:36
关注
下午好🌅🌅🌅
本答案参考通义千问

针对你提出的问题，即在零售行业中使用Python + SQLite编写商品查重程序时遇到的条码比对问题，我们可以从以下几个方面进行系统分析和解决方案设计。

一、问题分析

1. 条码格式的特殊性

商品条码通常为字符串类型（如："123456789012"），但其前几位字符可能相同，只有后几位才有区别。
当使用SQLite中的TEXT类型字段并设置唯一性约束或主键时，数据库会逐字符比较整个字符串，导致即使前几个字符相同，也会被判定为重复。

2. 现有方案的不足

使用唯一性约束或主键约束无法满足实际需求，因为它们是基于完整字符串匹配的。
使用查询后再判断是否重复逻辑复杂，容易出错，尤其是在多线程或多用户环境下。

二、稳妥的查重程序编写思路

为了确保程序稳定、高效地实现“避免重复配货”的目标，建议采用以下思路：

1. 数据库设计优化

不将条码设为主键或唯一索引，而是单独维护一个商品表和配货记录表。
在配货记录表中增加一个字段，用于存储已配货的商品ID或条码，并通过查询判断是否存在该条码。

示例表结构：

CREATE TABLE products ( id INTEGER PRIMARY KEY, barcode TEXT NOT NULL UNIQUE ); CREATE TABLE order_records ( id INTEGER PRIMARY KEY, product_id INTEGER, FOREIGN KEY (product_id) REFERENCES products(id) );

注意： products.barcode 设置为 UNIQUE 是合理的，因为它代表的是商品本身的唯一标识，而不是配货记录。

2. 查重逻辑实现

✅ 推荐方式：先查再插入

在每次配货前，先检查数据库中是否有该条码对应的商品。
如果存在，则跳过；如果不存在，则插入新商品并记录配货信息。

Python代码示例：

import sqlite3 def add_product_and_order(conn, barcode): cursor = conn.cursor() # 检查商品是否已存在 cursor.execute("SELECT id FROM products WHERE barcode = ?", (barcode,)) result = cursor.fetchone() if result: print(f"商品 {barcode} 已存在，不重复配货。") return False # 插入新商品 cursor.execute("INSERT INTO products (barcode) VALUES (?)", (barcode,)) product_id = cursor.lastrowid # 记录配货信息 cursor.execute("INSERT INTO order_records (product_id) VALUES (?)", (product_id,)) conn.commit() print(f"成功添加商品 {barcode} 到配货记录。") return True

关键点： 通过查询确认商品是否存在，而不是依赖唯一性约束，可以更灵活地控制逻辑。

3. 增加缓存机制（可选）

对于高频访问的条码，可以使用内存缓存（如字典）来快速判断是否重复，减少数据库查询次数。

barcode_cache = {} def is_duplicate(barcode): return barcode in barcode_cache def add_to_cache(barcode): barcode_cache[barcode] = True

三、性能与稳定性优化建议

| 优化点 | 说明 | |--------|------| | 事务处理 | 使用 BEGIN TRANSACTION 和 COMMIT 确保数据一致性 | | 并发控制 | 若多用户同时操作，建议使用锁机制或连接池 | | 日志记录 | 添加详细的日志输出，便于排查错误 | | 异常处理 | 捕获数据库异常，防止程序崩溃 |

四、是否需要更换数据库？

❌ 不推荐更换数据库（如MySQL/PostgreSQL）

SQLite 已足够应对你的业务场景，尤其在轻量级应用中表现良好。
更换数据库会带来额外的学习成本和部署复杂度。

✅ 仅在以下情况考虑更换：

需要支持高并发写入（如每秒数千次操作）
需要复杂的查询或全文搜索功能

五、总结：稳妥的查重程序编写思路

合理设计数据库结构，避免使用不当的唯一性约束。
在程序中先查询再插入，确保逻辑清晰可控。
增加缓存机制提升性能。
加强异常处理和日志记录，提高程序健壮性。
优先使用SQLite，除非有明确的高性能需求。

六、修改后的完整代码示例

import sqlite3 # 初始化数据库 def init_db(): conn = sqlite3.connect('retail.db') cursor = conn.cursor() cursor.execute(''' CREATE TABLE IF NOT EXISTS products ( id INTEGER PRIMARY KEY, barcode TEXT NOT NULL UNIQUE ) ''') cursor.execute(''' CREATE TABLE IF NOT EXISTS order_records ( id INTEGER PRIMARY KEY, product_id INTEGER, FOREIGN KEY (product_id) REFERENCES products(id) ) ''') conn.commit() return conn # 添加商品并记录配货 def add_product_and_order(conn, barcode): cursor = conn.cursor() # 查询商品是否已存在 cursor.execute("SELECT id FROM products WHERE barcode = ?", (barcode,)) result = cursor.fetchone() if result: print(f"商品 {barcode} 已存在，不重复配货。") return False # 插入新商品 cursor.execute("INSERT INTO products (barcode) VALUES (?)", (barcode,)) product_id = cursor.lastrowid # 记录配货信息 cursor.execute("INSERT INTO order_records (product_id) VALUES (?)", (product_id,)) conn.commit() print(f"成功添加商品 {barcode} 到配货记录。") return True # 主函数测试 if __name__ == "__main__": conn = init_db() add_product_and_order(conn, "123456789012") # 第一次添加 add_product_and_order(conn, "123456789012") # 第二次尝试添加（应提示已存在） conn.close()

如果你有更多关于商品管理、配货流程或数据库优化的问题，欢迎继续提问！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

本科论文查重降重实施方法步骤
2026-03-19 23:00

沐硕的博客本文介绍了论文查重与降重的实用指南。推荐了超星、PaperPass、PaperYY等免费查重平台的使用方法，并分享了付费AIGC查重的经验。针对降重，作者对比了人工修改与AI工具的优劣，推荐使用特定降重平台改写全文，同时...
python毕设农产品商品管理系统论文+程序
2024-12-14 22:26

゛花昔计算机毕设源码程序的博客本选题将以农产品商品管理为研究情景，重点分析和研究农产品商品管理系统的构建与优化问题，以期探寻农产品商品管理高效化、精准化的问题原因，提出对策建议，为后续更加深入的研究提供基础。[8] 陈佳佳, 邱晓荣, 熊...
python毕设毕业生求职找房小程序小程序端程序+论文
2024-11-16 14:03

゛花学长计算机毕业设计的博客 8] 陈佳佳, 邱晓荣, 熊宇昊, 段莉华. "基于Python的人脸识别技术研究"[J].... "大数据专业Python程序设计课程建设探究"[J]. 知识窗(教师版), 2023, (10): 117-119.2024年02月: 根据需求分析，进行详细设计；
python毕设爱看漫画小程序的设计与实现程序+论文
2024-11-17 21:58

゛赵学长程序设计的博客本选题将以Python技术为研究情景，重点分析和研究爱看漫画小程序的设计与实现问题，以期探寻使用Python开发漫画小程序的最佳实践方式，提出对策建议，为后续更加深入的研究提供基础。漫画产业在现代娱乐文化中占据...
(开题报告)django+vue智盛社区生鲜超市小程序论文+源码
2024-10-26 19:17

゛花学长计算机毕业设计的博客本选题将以智盛社区生鲜超市为研究情景，重点分析和研究如何利用Django+Vue技术构建出满足用户需求、涵盖生鲜类型、生鲜信息展示、特价商品推广等功能的小程序，探寻社区生鲜线上销售与技术融合的最佳模式，为后续...
高校校园活动预约网站(需求文档)
2025-10-20 21:40

2501_93259621的博客（5）时间可行性：从大四开始，基本就没有了课程，这给了学生充足的时间来进行毕业设计的开发，而且在学校还可以随时向老师请教，完成程序，所以来说，在开发的时间方面，时间绰绰有余，不用考虑。 4.完成本课题所...
python毕设闲鱼交易平台程序+论文
2024-12-24 19:22

一念计算机毕设源码程序的博客 "大数据专业Python程序设计课程建设探究"[J]. 知识窗(教师版), 2023, (10): 117-119. [12] 朱向阳. "高中信息技术python项目式教学路径分析"[J]. 高考, 2023, (24): 126-128. 以上是开题是根据本选题撰写，是项目...
python毕设财务记账系统程序+论文
2024-11-19 19:31

゛花学长计算机毕业设计的博客 "大数据专业Python程序设计课程建设探究"[J]. 知识窗(教师版), 2023, (10): 117-119. [12] 朱向阳. "高中信息技术python项目式教学路径分析"[J]. 高考, 2023, (24): 126-128. 以上是开题是根据本选题撰写，是项目...
python毕设小型零售电商平台程序+论文
2024-12-27 11:35

゛林夕django毕设的博客本选题将以Python为技术基础构建小型零售电商平台为研究情景，重点分析和研究在这种小型平台下用户...对这些文献进行整理和分析，了解前人在小型零售电商平台研究中的成果与不足，为自己的研究提供理论依据和研究思路。
python毕设服装网站程序+论文
2025-01-12 15:34

゛小许程序设计的博客 "大数据专业Python程序设计课程建设探究"[J]. 知识窗(教师版), 2023, (10): 117-119. [12] 朱向阳. "高中信息技术python项目式教学路径分析"[J]. 高考, 2023, (24): 126-128. 以上是开题是根据本选题撰写，是项目...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月4日

码龄粉丝数原力等级 --

请教商品查重程序的思路

6条回答默认最新

码龄粉丝数原力等级 --

一、问题分析

1. 条码格式的特殊性

2. 现有方案的不足

二、稳妥的查重程序编写思路

1. 数据库设计优化

示例表结构：

2. 查重逻辑实现

✅ 推荐方式：先查再插入

Python代码示例：

3. 增加缓存机制（可选）

三、性能与稳定性优化建议

四、是否需要更换数据库？

❌ 不推荐更换数据库（如MySQL/PostgreSQL）

✅ 仅在以下情况考虑更换：

五、总结：稳妥的查重程序编写思路

六、修改后的完整代码示例

问题事件

码龄粉丝数原力等级 --

请教商品查重程序的思路

6条回答 默认 最新

一、问题分析

1. 条码格式的特殊性

2. 现有方案的不足

二、稳妥的查重程序编写思路

1. 数据库设计优化

示例表结构：

2. 查重逻辑实现

✅ 推荐方式：先查再插入

Python代码示例：

3. 增加缓存机制（可选）

三、性能与稳定性优化建议

四、是否需要更换数据库？

❌ 不推荐更换数据库（如MySQL/PostgreSQL）

✅ 仅在以下情况考虑更换：

五、总结：稳妥的查重程序编写思路

六、修改后的完整代码示例

问题事件

6条回答默认最新