【求大佬】数据库内容分割和水平分表问题

得到一个Mysql数据库（user），其中只有一个表（table1）和一个字段（number）。
内容如图：

老师要求：
①创建number1~9个表（共9个表），表中有两个字段分别是uid和name，

②把源数据中的数据以开头数字进行分类存储，比如1开头的存入number1表，2开头的存入number2表中。
（提取出来后还要删除元数据中的对应内容）

③存储时还要将元数据分割开，“-”前半段存到uid，“-”后半段存入name。遇到uid一致时，name用逗号隔开

注：源数据一共3千万条，一定要考虑到语句是否精简

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
树莓大王 2023-03-15 00:03
关注
针对这个问题，我可以给出以下的解决方案：

创建number1~9个表，表结构如下：

CREATE TABLE number1 ( uid int UNSIGNED NOT NULL, name varchar(200) NOT NULL, PRIMARY KEY(uid) )ENGINE=InnoDB CHARSET=utf8;

同理创建number2~9个表。

对源数据进行分类，可以使用以下语句：

INSERT INTO number1(uid,name) SELECT SUBSTRING_INDEX(number, '-', 1), SUBSTRING_INDEX(number, '-', -1) FROM table1 WHERE number LIKE '1%';

同理，使用类似的语句进行分类存储。

将元数据分割开存储，在插入语句中使用SUBSTRING_INDEX函数进行拆分。如果遇到uid相同的数据，则使用CONCAT_WS函数将name字段合并。

INSERT INTO number1(uid,name) SELECT SUBSTRING_INDEX(number, '-', 1), IFNULL(CONCAT_WS(',',n1.name,n2.name),'') AS name FROM table1 LEFT JOIN number1 AS n1 ON SUBSTRING_INDEX(table1.number, '-', 1)=n1.uid LEFT JOIN number1 AS n2 ON SUBSTRING_INDEX(table1.number, '-', 1)=n2.uid AND n1.name<>n2.name WHERE table1.number LIKE '1%' AND n1.uid IS NOT NULL;

同理，使用类似的语句进行拆分存储。在JOIN表的过程中，通过判断uid相同，但name不同时，使用CONCAT_WS将多个name进行合并。

总结：

以上是基于Mysql的解决方案，对于大量数据的处理方案一定要考虑到语句的精简以及效率的问题，可以在实际应用中进行针对性的优化。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

数据库优化系列之分表实践与思考
2023-10-10 02:25

糯米白茶的博客主要介绍分表,通过两个场景下的分表代码示例实现分表,讨论分表使用场景,引用了成体系的知识从概念到经验值,再到实现,创作跨度比较大后续会再次整理.
2024大数据面试题汇总(完善中。。。)
2024-06-18 16:10

hitits的博客自己汇总的面试题，涉及到大数据的常用组件，将持续更新... ... 部分图片不全，后期继续完善更新记录: 2024-6-18 初版0.1.0 :hadoop，hbase，doris，hive，mysql，es 2024-6-26 1.0.0 : java，spark，redis，kafka...
MySQL数据库面试题（2020最新版）
2020-03-10 17:20

RyanJohnson的博客文章目录数据库基础知识为什么要使用数据库什么是SQL？什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式？分别有什么区别？数据类型mysql有哪些数据类型引擎MySQL存储...
调优攻略：10个提高MySQL性能的实用技巧
2023-10-23 20:00

Java程序员廖志伟的博客文章目录表结构设计 MySQL数据库的页大小 B树和B+树的区别表结构设计建索引 SQL优化 SQL编写常用的SQL优化方法业务层逻辑优化 SQL性能优化 1. 编写优化的SQL语句 2. 创建合适的索引 3. 使用缓存和批量操作索引...
《大数据之路：阿里巴巴大数据实践》：看阿里人从IT时代走向DT时代的经验之谈！
2020-05-17 23:08

云祁的博客最近一直在看《大数据之路：阿里巴巴大数据实践》一书，读完之后感觉受益良多。第一，对于整个大数据的体系有了更多且清晰的认知；第二，对于不同系统的逻辑处理方式给予了引导；第三，毕竟是阿里多年技术的累计产出...
MySQL数据库面试题（2020最全最新）
2020-03-23 14:54

在下王某的博客 MySQL数据库面试题(2020最新版) 最近看到这篇文章作者写的很不错，总结的很不错希望能够帮到更多的人原创作者 ThinkWon 原文链接：https://blog.csdn.net/ThinkWon/article/details/104778621) ...
保姆级教程！手把手带你用数据库中间件Mycat，linux知识点总结
2021-09-08 21:17

m0_61440556的博客简单来说，我们可以将数据的水平切分理解为是按照数据行的切分，就是将表中的某些行切分到一个数据库，而另外的某些行又切分到其他的数据库中，如图拆分数据就需要定义分片规则。关系型数据库是行列的二维模型，...
MySQL数据库面试题（2021最新版）
2021-04-08 10:33

CRMEB定制开发的博客 数据库基础知识为什么要使用数据库 什么是SQL？什么是MySQL? 数据库三大范式是什么 mysql有关权限的表都有哪几个 MySQL的binlog有有几种录入格式？分别有什么区别？数据类型 mysql有哪些数据类型引擎 MySQL存储...
MySQL数据库面试题（2020最新版）已修改原作者笔误
2020-05-14 11:15

炮手00的博客文章目录数据库基础知识为什么要使用数据库什么是SQL？什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式？分别有什么区别？数据类型mysql有哪些数据类型引擎MySQL存储...
MySQL 三万字精华总结 + 面试100 问，和面试官扯皮，吹牛逼！绰绰有余（五：MySQL分区,分表，分库以及主从复制）收藏系列！
2020-07-25 16:02

测试小小小的博客九、分区、分表、分库 MySQL分区一般情况下我们创建的表对应一组存储文件，使用MyISAM存储引擎时是一个.MYI和.MYD文件，使用Innodb存储引擎时是一个.ibd和.frm（表结构）文件。当数据量较大时（一般千万条记录...
没有解决我的问题, 去提问

【求大佬】数据库内容分割和水平分表问题

1条回答 默认 最新

1条回答默认最新