阿黄Ahuang 2022-01-10 09:45 采纳率: 50%
浏览 62

大数据如何进行数据阶段的验证

通过查询资料,我了解到大数据的测试非常重要的是数据库测试。
而数据库测试又分为:数据验证,过程验证,输出验证
数据验证要做的事情如下:

  • 来自各方面的数据资源应该被验证,来确保正确的数据被加载进系统
  • 验证加载到Hadoop的数据和源数据是一致的
  • 验证正确的提取和加载数据至hdfs中

我有看到可以使用Talend做数据阶段验证,但Talend没有Linux版本,有别的方法做数据验证吗,除了Talend

  • 写回答

1条回答 默认 最新

  • DarkAthena ORACLE应用及数据库设计方案咨询师 2022-01-10 14:29
    关注

    对于源端和目标端,分别对所有行列的数据用同一种hash算法得出一个值,比如计算md5,再比较这个值是否一致,这是在验证阶段最减少数据输出的方式了

    评论

报告相同问题?

问题事件

  • 创建了问题 1月10日

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog