(转)SQL中group by详解

(转)SQL中group by详解

参考来源: 关于group by的用法 原理

我和原博文作者一样,突然间不会用group by了(可能是一直都不会用),就找了一下详解,这篇文章讲的很形象,学习一波

看一下测试表test 对这个表写group by时,可能就会发生下面这样的怪事:

select name from test group by name -- ok

select * from test group by name --error

select name,sum(number) from test group by name -- ok

行吧,接下来一步步的来看。

1. 单列group by

对 test表(表1)执行下面语句

select name from test group by name

结果很明显,这是表2

为了能够更好的理解“group by”多个列“和”聚合函数“的应用,由表1到表2的过程中,增加一个虚构的中间表:虚拟表3。下面说说如何来思考上面SQL语句执行情况:

from test:sql执行的第一步,找表,这个没啥变化;

from test group by name:没有join 和 where 操作,就是group by了,这时候的过程就如下图所示了,找到name那一列,将具有相同name值的行,合并成同一行。比如nama = aa时,就将<1,aa,2>和<2,aa,3>这两行合并,其它字段(id,number)合并在一个单元格;

接下来就对产生的虚拟表3进行select操作了,这时候就可以看出上面的几句select的问题出在哪了。

(1)直接 select name 是没问题的,因为group by 的字段就是name,每个单元格只有一个name,某闷忒;

(2)执行 select * 的话,就是从表3中选择,可是id 和 number 字段中的单元格里的内容有多个值,关系型数据库是不允许这样的,这样就无法形成严格的关系约束条件了,所以会报错;

那么,对于 id 和 number列咋办呢?聚合函数。

不知道大家有没有遇到过 aggregator blah blah 之类的报错,我用 group by 的时候就放过这个错,现在想来应该就是 后面用了 group by,却没对字段进行聚合,导致单元格里有多个值。

聚合函数,就是用来输入多个数据,输出一个数据的,如count(id), sum(number),每个聚合函数的输入就是每一个多数据的单元格。

因此,这里可以执行

select name,sum(number) from test group by name

那么sum 函数就是对虚拟表3中,每个name对应的number单元格进行sum操作,就可以得到:

2. 对多列进行 group by

那要是group by 多个字段怎么理解呢, 比如还是在test 表中,group by name,number,此时我们可以将name 和 number 看成一个整体字段,将其作为一个整体来进行判断划分的。如图: 这里只有 是 name 和 number 都相等的,所以将其进行合并,其余并不完全一样,所以没有进行分组合并。

此时执行以下语句

select name,sum(id) from test group by name,number

就可以得到 Done,再次感谢原博文作者。笔芯

相关推荐

强制执行的流程和执行时间一般是多久
365bet提款要多久

强制执行的流程和执行时间一般是多久

🪐 07-04 👁️ 6127
人类进化史420万年的空白期,为何如此重要?
365国际速发彩票

人类进化史420万年的空白期,为何如此重要?

🪐 08-05 👁️ 3992
如何在Win10 或 Win11 中打开任务管理器?在Win10/11 中打开任务管理器6种方法