mysql窗口函数有哪些(mysql8 窗口函数)

mysql窗口函数有哪些(mysql8 窗口函数)div id navCategory div MySQL8 窗口函数是一种特殊的函数 它可以在一组查询行上执行类似于聚合的操作 但是不会将查询行折叠为单个输出行 而是为每个查询行生成一个结果 窗口函数可以用来处理复杂的报表统计分析场景 例如计算移动平均值 累计和 排名等

大家好,我是讯享网,很高兴认识大家。



 <div id="navCategory"></div> 

讯享网

MySQL8 窗口函数是一种特殊的函数,它可以在一组查询行上执行类似于聚合的操作,但是不会将查询行折叠为单个输出行,而是为每个查询行生成一个结果。窗口函数可以用来处理复杂的报表统计分析场景,例如计算移动平均值、累计和、排名等。其中博主认为它展现的主要威力在于它能够让我们在不修改原有语句输出结果的基础上,直接添加新的聚合字段

窗口函数语法如下:

函数可以是聚合函数或者非聚合函数。MySQL8 支持以下几类窗口函数,

  • 序号函数:用于为窗口内的每一行生成一个序号,例如  等。
  • 分布函数:用于计算窗口内的每一行在整个分区中的相对位置,例如  等。
  • 前后函数:用于获取窗口内的当前行的前后某一行的值,例如  等。
  • 头尾函数:用于获取窗口内的第一行或最后一行的值,例如  等。
  • 聚合函数:用于计算窗口内的某个字段的聚合值,例如  等。


讯享网

关键字很重要,用来标识是否使用窗口函数,语法如下

两种形式都定义了窗口函数应该如何处理查询行。它们的区别在于窗口是直接在  中定义,还是基于  在  字句可以重复使用。

  • 常规用法,窗口规范直接出现在  子句中的括号之间。
  • 基于 ,是由查询中其他地方的  子句定义的窗口规范的名称,可以重复使用。本文后续会进行讲解。

子句用来将查询结果划分为不同的分区,窗口函数在每个分区上分别执行,语法如下

子句用来对每个分区内的查询结果进行排序,窗口函数将按照排序后的顺序进行计算,语法如下

是窗口函数的一个可选子句,用来指定每个分区内的数据范围,可以是静态的或动态的。语法如下

  • : 表示当前行。
  • : 表示分区中的第一行。
  • : 表示分区中的最后一行。
  • : 表示当前行减去的值。
  • : 表示当前行加上的值。

例如,如果指定了,则表示窗口范围包括当前行、前两行和后一行。如果指定了,则表示窗口范围包括当前行和值在当前行减去10以内的所有行。如果没有指定,则默认为,即从分区开始到当前行。

MySQL8的  是指在  子句中定义并命名的窗口,可以在  子句中通过窗口名来引用。使用  的好处是可以避免在多个子句中重复定义相同的窗口,而只需要在  子句中定义一次,然后在  子句中引用即可。例如,下面的查询使用了三个相同的窗口:

可以使用来简化为:

这样就只需要在  子句中定义一个名为的窗口,然后在三个子句中引用它。

如果一个  子句使用了  而不是 ,则可以在引用的窗口名后面添加其他子句来修改窗口。例如,下面的查询定义了一个包含分区的窗口,并在两个  子句中使用不同的排序来修改窗口:

这样就可以根据不同的排序来获取每个国家的第一年和最后一年。

一个命名窗口的定义本身也可以以一个窗口名开头。这样可以实现窗口之间的引用,但不能形成循环。例如,下面的查询定义了三个命名窗口,其中第二个和第三个都引用了第一个:

这样就可以根据不同的范围来计算每个值的累计和。

下面以一个简单的示例表来说明 MySQL8 窗口函数的用法,提前准备 sql 脚本如下

这是一个销售信息表,包含年份、国家、产品和利润四个字段。让我们基于窗口函数来进行一些统计分析,例如:

计算每个国家每年的总利润,并按照国家和年份排序

输出结果:

+------+---------+--------------+
| year | country | total_profit |
+------+---------+--------------+
| 2000 | Finland | 1600 |
| 2000 | Finland | 1600 |
| 2001 | Finland | 10 |
| 2000 | India | 1275 |
| 2000 | India | 1275 |
| 2001 | India | 75 |
| 2000 | USA | 1575 |
| 2000 | USA | 1575 |
| 2001 | USA | 1700 |
| 2001 | USA | 1700 |
| 2001 | USA | 1700 |
| 2002 | USA | 1300 |
| 2002 | USA | 1300 |
+------+---------+--------------+

可以看到,每个国家每年的总利润都被计算出来了,但是没有折叠为单个输出行,而是为每个查询行生成了一个结果。

在这里就体现出博主说的不修改原有结果的基础上,添加聚合字段的威力。

计算每个国家每种产品的销售排名,并按照国家和排名排序

输出结果:

+---------+------------+--------+-------+
| country | product | profit | rank1 |
+---------+------------+--------+-------+
| Finland | Computer | 1500 | 1 |
| Finland | Phone | 100 | 2 |
| Finland | Phone | 10 | 3 |
| India | Computer | 1200 | 1 |
| India | Calculator | 75 | 2 |
| India | Calculator | 75 | 2 |
| USA | Computer | 1500 | 1 |
| USA | Computer | 1500 | 1 |
| USA | Computer | 1200 | 3 |
| USA | TV | 150 | 4 |
| USA | TV | 100 | 5 |
| USA | Calculator | 75 | 6 |
| USA | Calculator | 50 | 7 |
+---------+------------+--------+-------+

可以看到,每个国家每种产品的销售排名都被计算出来了,使用了函数,它会给相同利润的产品分配相同的排名,并跳过之后的排名。细心的朋友可能会发现相同国家产品的销售排名重复之后,下一名会跳名次,如果不想这样可以使用  函数,

输出结果:

+---------+------------+--------+-------+
| country | product | profit | rank1 |
+---------+------------+--------+-------+
| Finland | Computer | 1500 | 1 |
| Finland | Phone | 100 | 2 |
| Finland | Phone | 10 | 3 |
| India | Computer | 1200 | 1 |
| India | Calculator | 75 | 2 |
| India | Calculator | 75 | 2 |
| USA | Computer | 1500 | 1 |
| USA | Computer | 1500 | 1 |
| USA | Computer | 1200 | 2 |
| USA | TV | 150 | 3 |
| USA | TV | 100 | 4 |
| USA | Calculator | 75 | 5 |
| USA | Calculator | 50 | 6 |
+---------+------------+--------+-------+

计算每个国家每种产品的累计利润,并按照国家和利润排序

输出结果:

+---------+------------+--------+-------------------+
| country | product | profit | cumulative_profit |
+---------+------------+--------+-------------------+
| Finland | Phone | 10 | 10 |
| Finland | Phone | 100 | 110 |
| Finland | Computer | 1500 | 1610 |
| India | Calculator | 75 | 75 |
| India | Calculator | 75 | 150 |
| India | Computer | 1200 | 1350 |
| USA | Calculator | 50 | 50 |
| USA | Calculator | 75 | 125 |
| USA | TV | 100 | 225 |
| USA | TV | 150 | 375 |
| USA | Computer | 1200 | 1575 |
| USA | Computer | 1500 | 3075 |
| USA | Computer | 1500 | 4575 |
+---------+------------+--------+-------------------+

可以看到,每个国家每种产品的累计利润都被计算出来了,使用了函数,并指定了作为窗口范围,表示从分区开始到当前行。

基于 重写问题三,sql 如下

输出结果:

+———+————+——–+——————-+
| country | product &nbsp; &nbsp;| profit | cumulative_profit |
+———+————+——–+——————-+
| Finland | Phone &nbsp; &nbsp; &nbsp;| &nbsp; &nbsp; 10 | 10 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| Finland | Phone &nbsp; &nbsp; &nbsp;| &nbsp; &nbsp;100 | 110 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |
| Finland | Computer &nbsp; | &nbsp; 1500 | 1610 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| India &nbsp; | Calculator | &nbsp; &nbsp; 75 | 75 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| India &nbsp; | Calculator | &nbsp; &nbsp; 75 | 150 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |
| India &nbsp; | Computer &nbsp; | &nbsp; 1200 | 1350 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| USA &nbsp; &nbsp; | Calculator | &nbsp; &nbsp; 50 | 50 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| USA &nbsp; &nbsp; | Calculator | &nbsp; &nbsp; 75 | 125 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |
| USA &nbsp; &nbsp; | TV &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp;100 | 225 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |
| USA &nbsp; &nbsp; | TV &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp;150 | 375 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |
| USA &nbsp; &nbsp; | Computer &nbsp; | &nbsp; 1200 | 1575 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| USA &nbsp; &nbsp; | Computer &nbsp; | &nbsp; 1500 | 3075 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
| USA &nbsp; &nbsp; | Computer &nbsp; | &nbsp; 1500 | 4575 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|
+———+————+——–+——————-+

优点:

  • 窗口函数可以在不改变原表行数的情况下,对每个分区内的查询行进行聚合、排序、排名等操作,提高了数据分析的灵活性和效率。
  • 窗口函数可以使用滑动窗口来处理动态的数据范围,例如计算移动平均值、累计和等。
  • 窗口函数可以与普通聚合函数、子查询等结合使用,实现更复杂的查询逻辑。

缺点:

  • 窗口函数的语法较为复杂,需要注意子句中的各个参数的含义和作用。
  • 窗口函数的执行效率可能不如普通聚合函数,因为它需要对每个分区内的每个查询行进行计算,而不是折叠为单个输出行。
  • 窗口函数只能在列表和子句中使用,不能用于、、等子句中。

关于查询性能这里,窗口函数的性能取决于多个因素,例如窗口函数的类型、窗口的大小、分区的数量、排序的代价等。一般来说,窗口函数的性能优于使用子查询或连接的方法,因为窗口函数只需要扫描一次数据,而子查询或连接可能需要多次扫描或连接。

但是,并不是所有的窗口函数都能高效地计算。一些窗口函数,例如、、等,只需要对分区内的数据进行排序,然后根据当前行的位置来计算结果,这些窗口函数的性能较好。另一些窗口函数,例如、、、等,需要对分区内或窗口内的数据进行聚合,这些窗口函数的性能较差。

为了提高窗口函数的性能,可以采用以下一些方法:

  • 选择合适的窗口函数,避免使用复杂或重复的窗口函数。
  • 使用来定义和引用窗口,避免在多个子句中重复定义相同的窗口。
  • 尽量减少分区和排序的代价,使用索引或物化视图来加速分区和排序。
  • 尽量减少窗口的大小,使用合适的来限制窗口内的数据范围。
  • 尽量使用并行处理来加速窗口函数的计算,利用多核或分布式系统来提高效率。

窗口函数的应用场景很广,可以完成许多数据分析与挖掘任务。MySQL8 支持窗口函数是一个非常棒的特性,大大提高了 MySQL 在数据分析领域的竞争力。希望通过这篇文章可以帮助大家对 MySQL8 的窗口函数有一个初步的认识。

以上就是详解MySQL8中的新特性窗口函数的详细内容,更多关于MySQL窗口函数的资料请关注脚本之家其它相关文章!

小讯
上一篇 2025-05-27 23:29
下一篇 2025-05-16 23:08

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/137726.html