【SQL开发实战技巧】系列(三十七):数仓报表场景☞从表内始终只有近两年的数据,要求用两列分别显示其中一年的数据聊行转列隐含信息的重要性

系列文章目录

【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事
【SQL开发实战技巧】系列(二):简单单表查询
【SQL开发实战技巧】系列(三):SQL排序的那些事
【SQL开发实战技巧】系列(四):从执行计划讨论UNION ALL与空字符串&UNION与OR的使用注意事项
【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS 和 INNER JOIN效率,我们要分场景不要死记网上结论
【SQL开发实战技巧】系列(六):从执行计划看NOT IN、NOT EXISTS 和 LEFT JOIN效率,记住内外关联条件不要乱放
【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起
【SQL开发实战技巧】系列(八):聊聊如何插入数据时比约束更灵活的限制数据插入以及怎么一个insert语句同时插入多张表
【SQL开发实战技巧】系列(九):一个update误把其他列数据更新成空了?Merge改写update!给你五种删除重复数据的写法!
【SQL开发实战技巧】系列(十):从拆分字符串、替换字符串以及统计字符串出现次数说起
【SQL开发实战技巧】系列(十一):拿几个案例讲讲translate|regexp_replace|listagg|wmsys.wm_concat|substr|regexp_substr常用函数
【SQL开发实战技巧】系列(十二):三问(如何对字符串字母去重后按字母顺序排列字符串?如何识别哪些字符串中包含数字?如何将分隔数据转换为多值IN列表?)
【SQL开发实战技巧】系列(十三):讨论一下常用聚集函数&通过执行计划看sum()over()对员工工资进行累加
【SQL开发实战技巧】系列(十四):计算消费后的余额&计算银行流水累计和&计算各部门工资排名前三位的员工
【SQL开发实战技巧】系列(十五):查找最值所在行数据信息及快速计算总和百之max/min() keep() over()、fisrt_value、last_value、ratio_to_report
【SQL开发实战技巧】系列(十六):数据仓库中时间类型操作(初级)日、月、年、时、分、秒之差及时间间隔计算
【SQL开发实战技巧】系列(十七):数据仓库中时间类型操作(初级)确定两个日期之间的工作天数、计算—年中周内各日期出现次数、确定当前记录和下一条记录之间相差的天数
【SQL开发实战技巧】系列(十八):数据仓库中时间类型操作(进阶)INTERVAL、EXTRACT以及如何确定一年是否为闰年及周的计算
【SQL开发实战技巧】系列(十九):数据仓库中时间类型操作(进阶)如何一个SQL打印当月或一年的日历?如何确定某月内第一个和最后—个周内某天的日期?
【SQL开发实战技巧】系列(二十):数据仓库中时间类型操作(进阶)获取季度开始结束时间以及如何统计非连续性时间的数据
【SQL开发实战技巧】系列(二十一):数据仓库中时间类型操作(进阶)识别重叠的日期范围,按指定10分钟时间间隔汇总数据
【SQL开发实战技巧】系列(二十二):数仓报表场景☞ 从分析函数效率一定快吗聊一聊结果集分页和隔行抽样实现方式
【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高
【SQL开发实战技巧】系列(二十四):数仓报表场景☞通过案例执行计划详解”行转列”,”列转行”是如何实现的
【SQL开发实战技巧】系列(二十五):数仓报表场景☞结果集中的重复数据只显示一次以及计算部门薪资差异高效的写法以及如何对数据进行快速分组
【SQL开发实战技巧】系列(二十六):数仓报表场景☞聊聊ROLLUP、UNION ALL是如何分别做分组合计的以及如何识别哪些行是做汇总的结果行
【SQL开发实战技巧】系列(二十七):数仓报表场景☞通过对移动范围进行聚集来详解分析函数开窗原理以及如何一个SQL打印九九乘法表
【SQL开发实战技巧】系列(二十八):数仓报表场景☞人员分布问题以及不同组(分区)同时聚集如何实现
【SQL开发实战技巧】系列(二十九):数仓报表场景☞简单的树形(分层)查询以及如何确定根节点、分支节点和叶子节点
【SQL开发实战技巧】系列(三十):数仓报表场景☞树形(分层)查询如何排序?以及如何在树形查询中正确的使用where条件
【SQL开发实战技巧】系列(三十一):数仓报表场景☞分层查询如何只查询树形结构某一个分支?如何剪掉一个分支?
【SQL开发实战技巧】系列(三十二):数仓报表场景☞对表中某个字段内的值去重
【SQL开发实战技巧】系列(三十三):数仓报表场景☞从不固定位置提取字符串的元素以及搜索满足字母在前数字在后等条件的数据
【SQL开发实战技巧】系列(三十四):数仓报表场景☞如何对数据分级并行转为列
【SQL开发实战技巧】系列(三十五):数仓报表场景☞根据条件返回不同列的数据以及Left /Full Join注意事项
【SQL开发实战技巧】系列(三十六):数仓报表场景☞整理垃圾数据:查找数据的连续性时间和重叠时间的关系,初始化开始结束时间
【SQL开发实战技巧】系列(三十七):数仓报表场景☞从表内始终只有近两年的数据,要求用两列分别显示其中一年的数据聊行转列隐含信息的重要性



前言

本篇文章讲解的主要内容是:需求一:T表内始终只有近两年的数据,要求时刻返回两列并且分别显示其中一年的数据。需求二:以Emp表中为例,要求每个job显示为一行,同类job的姓名分列显示,不够的显示为空
【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。


一、用"行转列"来得到隐含信息

示例数据如下:

with t as (
select 'A' as shop,'2013' as nyear, 123 as amount from dual 
union all
select 'A' as shop,'2012' as nyear, 200 as amount from dual 
)
select * from t;
SHOP NYEAR     AMOUNT
---- ----- ----------
A    2013         123
A    2012         200

T表内始终只有两年的数据,要求返回两列分别显示其中一年的数据,原始写法如下:

with t as (
select 'A' as shop,'2013' as nyear, 123 as amount from dual 
union all
select 'A' as shop,'2012' as nyear, 200 as amount from dual 
)
select 
max(decode(nyear,'2012',amount)) as s2012,
max(decode(nyear,'2013',amount)) as s2013
from t;
     S2012      S2013
---------- ----------
       200        123

现在的语句中,2012年与2013年是固定的,而数据库中每一年的数据都在变(上一年与本年),现要求不再固定为2012年与2013年。怎么办?
其实这就是把上一年与本年数据各写为两列,本例的max用错了,应该为sum。
首先可以用分析函数取出上一年的年份(min)和本年的年份(max),分别放在两列
里。

with t as
 (select 'A' as shop, '2013' as nyear, 123 as amount
    from dual
  union all
  select 'A' as shop, '2012' as nyear, 200 as amount
    from dual)
select shop,
       nyear,
       max(nyear) over() as max_year,
       min(nyear) over() as min_year,
       sum(amount) as amount
  from t
 group by shop, nyear
SHOP NYEAR MAX_YEAR MIN_YEAR     AMOUNT
---- ----- -------- -------- ----------
A    2012  2013     2012            200
A    2013  2013     2012            123

SQL> 

可以看到,我们把年份信息取出来,分别放在了两列中,这样就有了一个参照:

with t as
 (select 'A' as shop, '2013' as nyear, 123 as amount
    from dual
  union all
  select 'A' as shop, '2012' as nyear, 200 as amount
    from dual)
select shop,
       max(decode(nyear, max_year, amount)) as 今年,
       max(decode(nyear, min_year, amount)) as 去年
  from (select shop,
               nyear,
               max(nyear) over() as max_year,
               min(nyear) over() as min_year,
               sum(amount) as amount
          from t
         group by shop, nyear
        )
 group by shop;
 
SHOP         今年         去年
---- ---------- ----------
A           123        200

二、用隐藏数据进行行转列

有网友提出如下需求,用现有表scott.emp模拟,表中每个job显示为一行,同类job的姓名分列显示,不够的显示为空,结果如下:

JOB       S1         S2         S3         S4
--------- ---------- ---------- ---------- ----------
ANALYST   FORD       SCOTT                 
CLERK     ADAMS      JAMES      MILLER     SMITH
MANAGER   BLAKE      CLARK      JONES      
PRESIDENT KING                             
SALESMAN  ALLEN      MARTIN     TURNER     WARD

乍一看,这个语句不好写,因为没有可供case when选用的条件。其实这里的条件是隐藏的,就是各员工姓名的顺序。

with t as (
select ename, job, row_number() over(partition by job order by ename) as rn
  from emp
 order by job)
 select * from t;
ENAME      JOB               RN
---------- --------- ----------
FORD       ANALYST            1
SCOTT      ANALYST            2
ADAMS      CLERK              1
JAMES      CLERK              2
MILLER     CLERK              3
SMITH      CLERK              4
BLAKE      MANAGER            1
CLARK      MANAGER            2
JONES      MANAGER            3
KING       PRESIDENT          1
ALLEN      SALESMAN           1
MARTIN     SALESMAN           2
TURNER     SALESMAN           3
WARD       SALESMAN           4

14 rows selected

有这个序号后,我们可以把sn=l的放第一列,sn=2的放第二列…

with t as (
select ename, job, row_number() over(partition by job order by ename) as rn
  from emp
 order by job)
 select job, 
 max(case when rn=1 then ename end) as s1,
 max(case when rn=2 then ename end) as s2,
 max(case when rn=3 then ename end) as s3,
 max(case when rn=4 then ename end) as s4
 from t
 group by job;
 JOB       S1         S2         S3         S4
--------- ---------- ---------- ---------- ----------
ANALYST   FORD       SCOTT                 
CLERK     ADAMS      JAMES      MILLER     SMITH
MANAGER   BLAKE      CLARK      JONES      
PRESIDENT KING                             
SALESMAN  ALLEN      MARTIN     TURNER     WARD

如果用行转列函数,则为

 select job, s1, s2, s3, s4
   from (select ename,
                job,
                row_number() over(partition by job order by ename) as rn
           from emp
          order by job)
 pivot(max(ename)
    for rn in(1 as s1, 2 as s2, 3 as s3, 4 as s4));
JOB       S1         S2         S3         S4
--------- ---------- ---------- ---------- ----------
ANALYST   FORD       SCOTT                 
CLERK     ADAMS      JAMES      MILLER     SMITH
MANAGER   BLAKE      CLARK      JONES      
PRESIDENT KING                             
SALESMAN  ALLEN      MARTIN     TURNER     WARD

如果不知道有多少列怎么办?那就需要先查询,然后用循环语句自动拼装成需要的SQL然后查询即可:

declare
  v_max number;
  v_sql varchar2(4000);
begin
  select max(count(*)) into v_max from emp group by job;
  v_sql := 'select job, ' || chr(10);
  for i in 1 .. v_max loop
    if (i <> v_max) then
      v_sql := v_sql || ' max(case when rn=' || i ||
               ' then ename end) as s' || i || ',' || chr(10);
    else
      v_sql := v_sql || ' max(case when rn=' || i ||
               ' then ename end) as s' || i || chr(10);
    end if;
  end loop;
  v_sql := v_sql || ' from (
select ename, job, row_number() over(partition by job order by ename) as rn
  from emp
 order by job)  group by job';
  dbms_output.put_line(v_sql);
end;
 
 
select job, 
 max(case when rn=1 then ename end) as s1,
 max(case when rn=2 then ename end) as s2,
 max(case when rn=3 then ename end) as s3,
 max(case when rn=4 then ename end) as s4
 from (
select ename, job, row_number() over(partition by job order by ename) as rn
  from emp
 order by job)  group by job

总结

本篇文章讲解的主要内容是:需求一:T表内始终只有近两年的数据,要求时刻返回两列并且分别显示其中一年的数据。需求二:以Emp表中为例,要求每个job显示为一行,同类job的姓名分列显示,不够的显示为空

猜你喜欢

转载自blog.csdn.net/qq_28356739/article/details/129913622