首席IT民工 2020-11-09 16:07 采纳率: 100%
浏览 78
已结题

ETL中如何进行跨库join

我有两个数据库,分别存放资金记录(有订单id)和订单详情(订单表中有很多无效订单,也就是没付钱的)。资金和订单是多对一的关系。现在我需要把他们匹配起来放入数据仓库。我想到的方案是先取前一天的所有资金记录,然后拿着订单id去订单库里查询,然后再join到一起。但是kettle提供的工具貌似要把所有订单都查出来然后由kettle来join,这样数据量有点大。

 

  • 写回答

2条回答 默认 最新

  • 首席IT民工 2020-11-13 17:25
    关注

    我看了下,这个差不多要逐行执行,如果表的数据比较多(例如A表有5万数据,B表有1万数据,但是B表只有100条数据是和A关联的),采用这个方法,需要对每行A表数据查一次库,没有没办只查一次(使用类似select * from table_b where id in (select fk from table_a)),然后在内存中join

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月13日
  • 已采纳回答 5月5日

悬赏问题

  • ¥15 2020长安杯与连接网探
  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)