从SQL存储计数更有效吗？有什么缺点（同步等）？

I have a MySQL database with two tables I am interested in querying:

Users: Stores information about users such as userID etc.

Map: A map table containing about 7 million mapIDs (an index referring to a physical lat/long on earth).

Many of these mapIDs are associated to userIDs, so for example user #1 may have 10 mapIDs associated with him, user #2 may have 100 etc.

I am interested in knowing what is more efficient/safer/best practice to count how many mapIDs belong to a user when I query the database with a userID:

1) Query the Map table to count how many mapIDs belong to the userID, OR

2) Store the number of mapIDs belonging to users in an additional column in the Users table (e.g. mapCount), and only query this value (rather than searching the large Maps table each time).

I know option 2 will be faster, but I am worried about potential problems with synchronization etc. For example, every time a user performs an action (e.g. add a mapID to his account) I would add the userID to the associated mapID on the Maps table, and also increment the mapCount value in Users so that subsequent searches/actions will be faster. But what if the second query failed for some reason and the mapCount field fell out of synch? Is this worth the risk?

What is generally the best thing to do in this situation?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dream752614590 2017-04-18 02:18
关注
If you are building the database, start by using a query to extract the data you want using a query. You can optimize this query by adding an index on map(usersId). If the performance is adequate, you are done.

If performance is not sufficient, then you can consider storing the count separately. Maintaining the count requires triggers on insert and delete and possibly on update.

These triggers will have an effect on performance when adding and modifying data. This is usually small, but it can be important. If you are doing bulk-load operations, then you will need to manually handle the summarization values.

All this maintenance is a lot of work, and you should only go down that path if you really need to do it that way.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

在sql中多大的数据才算是大数据？ java mysql 数据库
2022-03-31 17:24

回答 5 已采纳其实没有实际的标准明确定义多少数据量算大数据，不过阿里开发手册中建议，表数据超过500万条时，建议考虑分表，以防影响查询效率，不过我们公司也有单表超过几千万条的数据，效率确实不高，所以理论上百万级别以
SQL sever 多条件计数问题？ sql 有问必答
2022-01-17 19:44

回答 2 已采纳问这种sql问题时,请提供建表sql及测试数据sql,方便回答者进行测试,要不然就会像上面专家那样写了个语法都不对的sql(中间少了where) update 名单 as m set 迟到次数=(se
这段代码会有sql注入的安全问题吗? sql
2017-12-06 03:59

回答 2 已采纳不知道诶，在取得对象之前有没有对对象做过处理？用正则表达式对取得的对象做一下处理才可能没有问题。
hadoop为什么是大数据学习的核心技术？
2020-01-06 15:45

juan333的博客当今世界，科技进步日新月异，互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式，深刻展示了世界发展的前景。未来的互联网就是大数据和云计算的...什么是大数据？ 大数据（big ...
sqlserver数据库插入中文变？？？ java postman sql
2020-08-27 09:20

回答 2 已采纳数据库表使用 nvarchar nchar，而不是 varchar char 设置默认的区域规则为中文 https://www.jb51.net/article/182489.htm ALTER
请问HeidiSQL导出MySQL表里的数字变成科学计数该怎么解决？ mysql 数据库
2022-03-01 11:32

回答 4 已采纳其实吧,导出的数据应该并没有变成科学计数法,是你打开的excel进行了自动格式化显示,你可以用文本编辑工具,比如记事本,打开这个csv文件,看这个csv文件里面的内容到底长什么样子
我不怎么会写SQL语句，有人可以帮我看看吗？大数据数据库
2021-12-31 01:49

回答 1 已采纳你这个表设计的是有问题的,没有关键列,关键列应该是自增长的唯一的。可以参考一下:https://www.runoob.com/sql/sql-tutorial.html CREATE TABLE T_
大数据存储技术期末复习（自用）
2023-02-25 23:52

St Clair的博客不支持海量数据：难以有效存储稀疏数据，存储记录数量有限 5. 可扩展性差：纵向扩展花费高，需要购买高额服务器，横向扩展性差 6. 数据库模式相对固定：严格遵循定义和约束，不够灵活非关系型数据库：MongoDB、...
sql server中登录服务器填入. 也可连接这个有什么意义吗？ sql
2018-01-16 02:22

回答 8 已采纳 .代表localhost本机而已。你填写.,localhost,本机ip，本机机器名，都将指向到同一个机器上。不同的别名解析而已。如果你填其他服务器的ip地址，或者其他服务器的机器名，域名
sql server 存储过程问题不知道为什么这个会出错？ sql
2018-10-28 11:13

回答 1 已采纳已经解决是因为 Stuid 开启了自增的原因导致报错
sqlserver设置时间为索引，如何操作？ sql sqlserver
2022-03-22 11:35

回答 1 已采纳这种效率太低了还要SQL表设计,直接上代码,CREATE UNIQUE INDEX index_nameON table_name (column_name)
《大数据面试题》面试大数据这一篇就够了
2020-05-05 09:23

abluer~的博客《大数据面试题》面试大数据这一篇就够了 Hadoop 常见面试题 Hive 常见面试题 Spark 常见面试题 Flume 常见面试题 Kafka 常见面试题 Hbase 常见面试题 Redis 20 问
我可以认识一个大数据的资深DN吗？数据仓库数据库开发
2022-08-12 14:49

回答 2 已采纳可以先从 B站的尚硅谷视频开始学习1、介于已经在做大数据的工作，但又不了解整个行业的东西，所以可以尚硅谷的离线项目来整体的学习一波2、等离线项目都学完了，对整个大数据的东西都有一定了解，可以再学习实时
Java面试不通过？这篇文章你看了吗？
2020-08-06 11:12

程序yang的博客注：本人才疏学浅，知识还在积累中，不能保证每个回答都满足各种等级的高手们，（由于一些技术的升级，部分答案不能保证实时同步准确，还请大家在阅读的时候多多留意）若发现有问题的话，请评论指出。.......
Hive数据存储格式有哪些？TextFile、SequenceFile、RCFile、ORCFile、Parquet有什么区别？为什么绝大多数都使用ORCFile、Parquet格式？
2023-03-16 15:10

一个写湿的程序猿的博客 Parquet 在存储数据时，也同 ORC 一样记录这些数据的元数据，这些元数据也同 Parquet 的文件结构一样，被分成多层文件级别的元数据、列块级别的元数据及页级别的元数据。Hive 是面向 OLAP 的，所以它的事务也和 ...
没有解决我的问题, 去提问

悬赏问题

¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？

从SQL存储计数更有效吗？ 有什么缺点（同步等）？

3条回答 默认 最新

悬赏问题

从SQL存储计数更有效吗？有什么缺点（同步等）？

3条回答默认最新