博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据核对与验证标准(一)
阅读量:5115 次
发布时间:2019-06-13

本文共 987 字,大约阅读时间需要 3 分钟。

 

所有表从大方向上有

1.表的验证:指标临时表的验证和 指标合并表的验证

2.数据验证:数据总量的验证,数据质量的验证(连续指标和离散指标)

 

 

1.临时表的总量的验证show partitions app.xxx_t_xxx;select * from app.xxx_t_xxx where batch_date='批次日期' limit100;select batch_date ,count(1) from app.xxx_t_xxx group by batch_date; 2.合并表的总量验证show partitions app.xxx_r_xxx;select * from app.xxx_r_xxx where batch_date='批次日期' limit100;3.中间表各个指标的统计a)非空填充率,最大值,最小值select     batch_date    ,指标    ,count(1)    ,sum(if trim(指标)<>'' and 指标 is not null,1,0)     ,max(指标)    ,min(指标)from app.xxx_t_xxx app.xxx_t_xxx group by batch_date,指标 order by batch_date,指标 ;b)枚举类型的各个类型的数量分布select batch_date,指标,count(1) from app.xxx_r_xxx group by batch_date ,指标 order by batch_date,指标;4.合并表各个指标的统计a)非空填充率,最大值,最小值select      指标    ,count(1)    ,sum(if trim(指标)<>'' and 指标 is not null,1,0)     ,max(指标)    ,min(指标)from app.xxx_t_xxx app.xxx_t_xxx group by 指标 order by 指标 ;b)枚举类型的各个类型的数量分布select 指标,count(1) from app.xxx_r_xxx group by 指标 order by 指标;

 

转载于:https://www.cnblogs.com/wqbin/p/11275008.html

你可能感兴趣的文章
java NIO
查看>>
人月神话有感
查看>>
节奏把握
查看>>
折半插入排序C/C++
查看>>
默认参数和命名关键字参数(1)
查看>>
模拟客户端浏览器-1
查看>>
正则校验
查看>>
十大PHP程序员必备工具
查看>>
使用excel2003中的solver解决最优化问题
查看>>
CDR案例:广告条幅banner设计
查看>>
【贪心】 【HDU 5821】 Ball
查看>>
.NET性能优化方面的总结(转)
查看>>
关于jmeter 加载jar文件的疑问
查看>>
windows下nginx安装、配置与使用
查看>>
leetcode - Binary Tree Preorder Traversal
查看>>
poj2186【利用强连通分量】
查看>>
HDU1829【种类并查集】
查看>>
搭建nuxtjs程序 —— 用户信息 or token怎么不丢失
查看>>
Android快速开发(2)
查看>>
Windows下的SQL Server备份文件BAK在Linux环境下还原遇到的问题
查看>>