一聚教程网:一个值得你收藏的教程网站

热门教程

如何在SQL中使用LAST_VALUE函数获取分组数据的最后一条记录

时间:2026-07-02 11:13:51 编辑:袖梨 来源:一聚教程网

LAST_VALUE不可靠地取分组最后一条记录,因其默认帧仅到当前行;真正取最后一条应使用ROW_NUMBER()配合ORDER BY和WHERE rn=1筛选。

LAST_VALUE 不是取分组“最后一条记录”的可靠方式,它返回的是窗口帧内(默认是 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)的最后一个值,通常不是你想要的“分组末尾那条原始记录”。

为什么 LAST_VALUE 默认行为不符合“取最后一条记录”的直觉?

SQL 的 LAST_VALUE 是一个窗口函数,它的结果高度依赖 OVER() 子句中的 ORDER BY 和帧定义(ROWSRANGE)。默认帧是 UNBOUNDED PRECEDING TO CURRENT ROW,这意味着对每一行,它只看从分区开头到当前行的数据——所以最后一行才得到真正的“最后值”,其余行得到的是截至当前行的局部最后值。

  • 如果你按时间升序排序,LAST_VALUE(col) 在中间行返回的是“到此刻为止的最大/最新值”,不是整组最终值
  • 即使加了 ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING,它仍可能因重复排序键导致非确定性结果
  • 它不改变行数,只是为每行附加一个值,无法直接“筛选出最后一条记录”

真正想取每组最后一条原始记录,该用什么?

要用能做行级筛选的方案,而不是仅靠窗口函数赋值。主流可靠做法是结合 ROW_NUMBER()RANK() 配合子查询/CTE:

  • 按业务逻辑定义“最后”:通常是时间字段最大、ID 最大或插入顺序最晚 → 用 ORDER BY created_at DESCid DESC
  • ROW_NUMBER() OVER (PARTITION BY group_col ORDER BY created_at DESC) 给每组内的行编号
  • 外层 WHERE rn = 1 筛出每组排第一的那条(即“最后一条”)
  • 注意:若存在并列(如相同 created_at),ROW_NUMBER() 保证只选一条;RANK() 可能返回多条,需根据业务判断是否接受

示例:

SELECT id, user_id, status, created_atFROM (  SELECT *,         ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC, id DESC) AS rn  FROM orders) tWHERE rn = 1;

LAST_VALUE 什么时候能凑合用?

仅当你**不需要删行,只需要把“每组最后的某个字段值”广播到本组所有行上**时,LAST_VALUE 才有意义,且必须显式指定帧:

  • 写法必须是:LAST_VALUE(col) OVER (PARTITION BY group_col ORDER BY sort_col ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING)
  • 必须确保 ORDER BY 列组合能唯一确定顺序,否则重复值会导致 LAST_VALUE 返回任意一个(无保证)
  • 性能上比 ROW_NUMBER() + 过滤略差,因为要计算全帧,且结果仍是多行

例如:给每个订单补上该用户最新订单的 status

SELECT id, user_id,       LAST_VALUE(status) OVER (         PARTITION BY user_id          ORDER BY created_at, id          ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING       ) AS latest_statusFROM orders;

真要“取最后一条记录”,别绕弯子拼 LAST_VALUEROW_NUMBER() + WHERE rn = 1 是最直接、可读、可控的方式。容易被忽略的是排序键的唯一性——如果 ORDER BY 字段有重复,务必补一个确定性次序字段(比如主键 id),否则结果不可预期。

热门栏目