unnest()
函數與元素編號當遇到包含分隔值的列時,unnest()
函數提供了一種提取這些值的方法:
myTable
id | elements
--- ------------
1 |ab,cd,efg,hi
2 |jk,lm,no,pq
3 |rstuv,wxyz
select id, unnest(string_to_array(elements, ',')) AS elem
from myTable
id | elem
--- -----
1 | ab
1 | cd
1 | efg
1 | hi
2 | jk
...
但是,您可能希望也包含元素編號,格式如下:
id | elem | nr
--- ------ ---
1 | ab | 1
1 | cd | 2
1 | efg | 3
1 | hi | 4
2 | jk | 1
...
最終目標是在不使用窗口函數(如 row_number()
或 rank()
)的情況下獲得源字符串中每個元素的原始位置,因為這些函數始終返回 1,這可能是因為所有元素都位於源表的同一行中。
對於逗號分隔的字符串,請使用 string_to_table()
代替 unnest(string_to_array())
:
SELECT t.id, a.elem, a.nr
FROM tbl t
LEFT JOIN LATERAL string_to_table(t.elements, ',') WITH ORDINALITY AS a(elem, nr) ON true
對於返回集合的函數,使用 WITH ORDINALITY
:
SELECT t.id, a.elem, a.nr
FROM tbl AS t
LEFT JOIN LATERAL unnest(string_to_array(t.elements, ',')) WITH ORDINALITY AS a(elem, nr) ON true
LEFT JOIN ... ON true
確保保留左側表中的所有行,而不管右側表表達式是否返回任何行。
或者,由於 LEFT JOIN ... ON true
保留了所有行,因此可以使用更簡潔的查詢版本:
SELECT t.id, a.elem, a.nr
FROM tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr)
對於實際數組(arr
為數組列),可以使用更簡潔的形式:
SELECT t.id, a.elem, a.nr
FROM tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr)
為了簡單起見,可以使用默認列名:
SELECT id, a, ordinality
FROM tbl, unnest(arr) WITH ORDINALITY a
還可以進一步簡化:
SELECT * FROM tbl, unnest(arr) WITH ORDINALITY a
此最終形式返回 tbl
的所有列。當然,顯式指定列別名和表限定列可以提高清晰度。
a
既用作表別名,也用作列別名(對於第一列),附加的序號列的默認名稱為 ordinality
。
使用 row_number() OVER (PARTITION BY id ORDER BY elem)
根據排序順序(而不是序號位置)獲取數字:
SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t
雖然這通常有效,並且在簡單的查詢中沒有觀察到失敗,但 PostgreSQL 不保證在沒有 ORDER BY
的情況下行的順序。當前行為是實現細節的結果。
要保證空格分隔字符串中元素的序號:
SELECT id, arr[nr] AS elem, nr
FROM (
SELECT *, generate_subscripts(arr, 1) AS nr
FROM (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
) sub
對於實際數組,可以使用更簡單的版本:
SELECT id, arr[nr] AS elem, nr
FROM (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t
由於 PostgreSQL 8.1 到 8.4 版本缺少某些功能,例如 RETURNS TABLE
、generate_subscripts()
、unnest()
和 array_length()
,因此可以使用名為 f_unnest_ord
的自定義 SQL 函數:
CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) 1
FROM generate_series(array_lower($1,1), array_upper($1,1)) i'
修改後的函數如下:
CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) 1, i
FROM generate_series(array_lower($1,1), array_upper($1,1)) i'
此擴展函數 f_unnest_ord_idx
返回附加的 idx
列。比較:
SELECT id, arr, (rec).*
FROM (
SELECT *, f_unnest_ord_idx(arr) AS rec
FROM (
VALUES
(1, '{a,b,c}'::text[]) -- short for: '[1:3]={a,b,c}'
, (2, '[5:7]={a,b,c}')
, (3, '[-9:-7]={a,b,c}')
) t(id, arr)
) sub
輸出
id | arr | val | ordinality | idx
---- ----------------- ----- ------------ -----
1 | {a,b,c} | a | 1 | 1
1 | {a,b,c} | b | 2 | 2
1 | {a,b,c} | c | 3 | 3
2 | [5:7]={a,b,c} | a | 1 | 5
2 | [5:7]={a,b,c} | b | 2 | 6
2 | [5:7]={a,b,c} | c | 3 | 7
3 | [-9:-7]={a,b,c} | a | 1 | -9
3 | [-9:-7]={a,b,c} | b | 2 | -8
3 | [-9:-7]={a,b,c} | c | 3 | -7
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3