再看我把你吃掉 2022-03-22 18:02 采纳率: 50%
浏览 161
已结题

数据库设计一定要用id做为主键吗?看到阿里规范上是这么说的

我有一个场景:
1、有10台设备,编号为station1,station2,到station10,这10个设备的任一台,每隔1小时都会发送一条测量数据(可以测ABCDEFG7种因子)。
2、编号字段为station_code,时间为recv_time
在上述场景中,数据表应该如何设计呢?
我设计的是用station_code+recv_time作为联合主键,来保证记录的唯一性。同时增加idx_code和idx_time两个索引。

我觉得,基于上述场景,如果再来一个id自增主键,岂不是没什么用吗?后期业务,我查询数据,无非也是基于编号查,或者基于时间查,单条记录的ID总感觉是多余的?

  • 写回答

4条回答 默认 最新

  • DarkAthena ORACLE应用及数据库设计方案咨询师 2022-03-22 21:43
    关注

    这种流水记录,不要使用时间作为主键,
    打个比方,假设由于什么不可预知的原因,同一个设备1秒内连发两条,然后后面那条数据才是正确的,由于你设置了主键,数据就写不进去,然后假设这玩意做了失败异步重试,就会一直重试到设定的重试次数上限,最终数据还是丢了,而且还浪费了资源。
    因此,宁愿数据多写进来几条,之后再去做数据清洗,也一定要保证数据的完整性,或者在程序逻辑里做好控制。
    留着id,到时候在数据运维阶段就可以知道数据产生的先后顺序了,光靠时间其实无法判断先后顺序的,因为时间精度有限。最简单的例子,写个开窗函数发现有几行的时间都一样,无法排序,id就有用了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 4月22日
  • 已采纳回答 4月14日
  • 创建了问题 3月22日

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助