```bash
postgreSQL同时多任务读取场景下的表设计问题
请教各位大佬,现在有这样一个业务场景,该如何设计数据表?
一、爬虫端:
爬虫服务端有多个爬虫任务,采集的数据均写入同一个数据库和数据表中。目前数据库已有约五千万行数据。每日还在增加。
爬虫A 每日添加约30-50 万个新的任务关键词。单次往表里写入的字段约10个。爬虫A每天运行的时间约为5小时。
爬虫B 、C、D根据任务关键词分别爬取不同的数据源1、数据源2、数据源3。这三个爬虫全天24小时运行。
这三个数据源各自返回对应的json数据,总共包含约80-90个键值 。
我目前的做法是从json中把每个键值抽出来作为一个单独的表字段。把三个数据源的数据跟任务关键词数据全部放到同一行中。
现在一行有94个字段。
二、用户端:
用户在后台需要经常查询上述采集到的数据,且查询可用的过滤条件大概有 80个。 就是说数据表中的字段大部分都要作为查询条件。
需要支持最少50个用户同时查询。
遇到的问题:
查询很慢。
虽然有几个字段建立了索引,但我猜测是多个任务同时读写导致用户查询数据时响应卡顿。要几分钟才能返回数据,有时甚至卡死。
我的需求:
1、如何重新设计数据表?希望可以说得详细些。如有图示更好。
2、如果需要买单独的postgresql 数据库(阿里云或腾讯云)需要什么样的配置?
非常感谢
```