系统开发过程中，大家是如何防止基础资料重复问题的。

假设有一个供应商的基础资料表。
首先，系统本身肯定设置了重复判断，重复则不允许添加。

但当把新增这个表的权限赋给用户，用户往往会新增出很多重复的内容。

比如库中已有供应商“阿里巴巴集团控股有限公司”

但当一个用户来新增时，可能不会按照规范搜索没有再新增的步骤，会直接新增一个“阿里巴巴集团”。

“阿里巴巴集团控股有限公司”和“阿里巴巴集团”本来属于同一个公司，但因为名字不一样，他跳过了程序的重复检测，重复加入了表库中。

再比如“（地区）公司” 重复新增 “(地区)公司” 后者括号为小写，依旧能在库中新增重复内容。

想请问一下，大家在实际应用中，是如何处理这种问题的？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-01-16 11:15
关注
上午好☀️☀️☀️️
本答案参考通义千问

在系统开发过程中，防止基础资料重复的问题是一项重要的任务。通常情况下，除了系统本身的重复检查机制外，还需要采取一些额外的措施来确保数据的唯一性。以下是几种常见的方法：

严格的数据验证规则：

在输入数据时，对输入的数据进行严格的格式化和标准化处理。例如，将所有字符统一转换为小写或大写，去除多余的空格等。
使用正则表达式或其他方法对输入数据进行校验，确保输入的数据符合预设的格式。

增强的重复检测逻辑：

在插入数据之前，对数据库中的现有数据进行更细致的比较。例如，可以使用模糊匹配算法（如Levenshtein距离）来判断两个字符串是否相似。
实施更复杂的索引策略，如全文索引，以提高查询效率和准确性。

用户界面设计优化：

在用户界面中增加自动补全功能，提示用户已存在的数据选项。
显示警告信息，告知用户所输入的数据可能已经存在，并建议用户确认是否继续添加。

业务流程改进：

对用户进行培训，使其了解正确的操作流程，避免不必要的重复输入。
实施审批流程，只有经过审核的数据才能被正式添加到数据库中。

后台数据清洗：

定期对数据库进行数据清洗，识别并合并重复的数据记录。
开发专门的工具或脚本用于批量处理重复数据。

下面是具体的代码示例，演示如何通过标准化输入数据来避免重复：

import re def standardize_name(name): # 将所有字符转换为小写 name = name.lower() # 去除多余空格 name = re.sub(r'\s+', ' ', name).strip() return name def add_supplier(supplier_name): # 标准化供应商名称 standardized_name = standardize_name(supplier_name) # 查询数据库中是否存在相同名称的供应商 existing_supplier = query_database_for_supplier(standardized_name) if existing_supplier: print(f"供应商 '{supplier_name}' 已经存在。") return False # 如果不存在，则插入新的供应商记录 insert_into_database(standardized_name) print(f"成功添加供应商 '{supplier_name}'。") return True # 示例函数：模拟数据库查询 def query_database_for_supplier(name): # 这里应该替换为实际的数据库查询逻辑 # 假设存在名为 '阿里巴巴集团' 的供应商 if name == "阿里巴巴集团": return True else: return False # 示例函数：模拟数据库插入 def insert_into_database(name): # 这里应该替换为实际的数据库插入逻辑 pass # 测试代码 add_supplier("阿里巴巴集团控股有限公司") add_supplier("阿里巴巴集团")

在这个示例中，standardize_name 函数负责将输入的供应商名称标准化，add_supplier 函数则利用该标准化名称来检查数据库中是否存在相同的供应商记录。如果存在，则提示用户并拒绝添加；否则，插入新的记录。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【Java基础知识 1】编程语言类型有哪些？我心中的TOP1编程语言，什么是java跨平台性？
2023-07-08 15:02

哪吒的博客总的来说，高级语言是一种与具体硬件和操作系统无关的编程语言，它更接近于自然语言和数学语言，具有更高的可读性和可维护性。缺点：难记、难读、难修改。Java运行时和虚拟机是Java编程语言的核心组成部分，它们提供...
(完整版)ST语言编程手册.pdf
2020-08-05 09:02

ST语言，也称为结构化文本(ST)，是一种高级编程语言，它基于文本，用于工业自动化和控制系统的编程。根据IEC61131-3标准，ST语言被广泛应用于可编程逻辑控制器(PLC)和其他工业设备中。PLCopen是一个全球性的行业协会...
一文了解国产算子编程语言 TileLang，TileLang 对国产开源生态的影响与启示
2025-10-01 12:40

叶庭云的博客 TileLang 旨在简化高性能 GPU/CPU 内核...通过在 TVM 之上构建底层编译器基础设施，并采用 Pythonic 语法，tile-lang 使开发者能够专注于提升开发效率（门槛较低、易用），而无需牺牲实现最佳性能所需的底层优化。
IntelliJ IDEA是java编程语言的集成开发环境丨产品简介
2022-11-18 08:00

金科软件的博客虽然 IntelliJ IDEA 是一种适用于 Java 的 IDE，但它也理解大量其他语言（例如 SQL、JPQL、HTML、JavaScript 等）并提供智能编码辅助，即使当语言表达式被注入到 Java 代码的字符串文字中也能够辨识。当 IntelliJ ...
机器人操作系统ROS 编程开发--详细总结
2019-07-10 22:11

躬行见万象的博客机器人操作系统ROS，是一种分布式处理框架（又名Nodes），ROS常用C++和python编程语言开发；（这里项目开发采用C++ 11版本）。ROS的点对点设计以及服务和节点管理器等机制，可以分散由计算机视觉和语音识别等功能...
如何设计一门编程语言？
2024-06-26 23:12

锅总的博客思考了解如何设计一门编程语言~
编程语言发展史之：编程语言的未来趋势
2023-09-25 01:00

Agent架构研习社的博客 编程语言”这个概念在近几年间已经成为现代科技...对于编程语言来说，如何走向成熟并取得成功，将是一个至关重要的问题。为了给读者提供一个深入浅出的理解，本文从编程语言的历史开始，一步步阐述编程语言发展的脉络。
每个开发人员都应该学习的5种编程语言（上）
2022-09-07 08:00

新钛云服的博客然而，也有一些程序员在日常工作中有机会使用多种编程语言。例如，如果程序员使用Flatter本机模块，则有机会使用Dart、Kotlin（或Java）、Objective-C（或Swift）、C/C++等。大多数程序员在一种语言上工作了几十年，...
Python基础 - Python与其他编程语言的简单对比
2026-02-06 11:58

知远漫谈的博客本文对比了Python与Java、C++等主流编程语言的特性差异。Python以简洁语法和动态类型见长，适合快速开发，但受GIL限制多线程性能；Java的静态类型和JVM优化更适合大型企业应用；C++提供精细内存控制和极致性能，但...
编程语言发展史之：逻辑编程语言
2023-09-24 02:12

Agent架构研习社的博客作者：禅与计算机程序设计艺术 1.简介逻辑编程（logical programming）是一种编程范式，...逻辑编程倾向于通过构造计算机所理解的数学逻辑模型来解决问题。它特别适用于那些对数据结构和算法模型十分敏感的问题。与函
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月16日

系统开发过程中，大家是如何防止基础资料重复问题的。

2条回答 默认 最新

问题事件

2条回答默认最新