Chapter 10. 類型轉換

Table of Contents
10.1. 概述
10.2. 操作符
10.3. 函數
10.4. 值儲存
10.5. UNIONCASEARRAY構造

SQL 語句可能(有意無意地)要求在同一資料表達式裡混合不同的資料類型。 PostgreSQL 在計算混合類型資料表達式方面有許多擴展性很強的功能。

在大多數情況下,用戶不需要明白類型轉換機制的細節。 但是,由 PostgreSQL 所進行的隱含的類型轉換會對查詢的結果產生影響, 必要時這些影響又可以用明確的類型轉換進行剪裁利用。

本章介紹 PostgreSQL類型轉換的傳統和機制。 關於特定的類型和函數及操作符的進一步訊息, 請參考Chapter 8Chapter 9裡的相關章節。

10.1. 概述

SQL 是強類型語言。 也就是說,每一資料都與一個決定其行為和可行用法的資料類型相聯。 PostgreSQL 有一個可擴展的資料類型系統, 該系統比其他 SQL 實現實現更具通用性和靈活性。 因而,PostgreSQL中大多數類型轉換的特性是由通用規則來管理的, 而不是由專門搜索方法來分析,以此令混合類型資料表達式有實際意義,即便是用戶定義的類型也如此。

PostgreSQL 掃瞄/分析器只將詞法元素分解成五個基本種類: 整數(integers),浮點數(floating-point numbers), 字元串(strings),名字(names)和關鍵字(keywords)。 大多數擴展的類型首先資料表徵為字元串(strings)。 SQL 語言的定義允許將類型名聲明為字元串,這個機制被 PostgreSQL 用於令分析器沿著正確的方向執行。例如,下面查詢

SELECT text 'Origin' AS "label", point '(0,0)' AS "value";

 label  | value
--------+-------
 Origin | (0,0)
(1 row)

有兩個文本常量,類型分別為 textpoint。 如果沒有為字串文本聲明類型, (該文本)先被初始化成一個擁有儲存空間的 unknown(未知)類型, 該類型將在後面描述的晚期階段分析。

PostgreSQL 分析器裡, 有四種基本的 SQL 元素需要獨立的類型轉換規則:

函數調用

多數 PostgreSQL 類型系統是建築在一套豐富的函數上的。 函數調用可以有一個或多個參數。 因為 PostgreSQL 允許函數重載, 所以函數名自身並不唯一地標識將要調用的函數 — 分析器必須以函數提供的參數的類型為基礎選擇正確的函數。

操作符

PostgreSQL 也允許使用左目或右目操作符(單目操作符,一個參數), 允許資料表達式裡使用雙目操作符(兩個參數)。

值儲存

SQL INSERTUPDATE 語句將資料表達式結果放入資料表中。 語句中的資料表達式類型必須和的目標列的類型一致或者是(可能需要)轉換成一致的。

UNIONCASEARRAY 構造

因為聯合SELECT語句中的所有查詢結果必須在一列裡顯示出來, 所以每個SELECT 子句中的元素類型必須相互匹配並轉換成一套統一類型。 類似,一個CASE構造的結果資料表達式必須轉換成統一的類型, 這樣CASE資料表達式自身作為整體有一種已知輸出類型。 同樣的要求也存在於 ARRAY 構造中。

系統資料表儲存有關哪種資料類型之間的轉換(叫 casts )是合法的, 以及如何執行這些轉換的訊息。額外的轉換可以由用戶透過 CREATE CAST 命令增加。(通常和定義一種新的資料類型一起完成。 內置類型的類型轉換集已經經過仔細的雕琢了,因此最好不要去更改它們。)

分析器中還有一個搜索器用於更好地猜測 SQL 標準類型的確切特性。 分析器裡定義了幾種類型範疇booleannumericstringbitstringdatetimetimespangeometricnetwork,和用戶定義(user-defined)。 除用戶定義類型外, 每種類型都有一種首選類型用於解決類型定義歧義的問題。 對於用戶定義的類型,其自身就是自己的首選類型,所以那些含混不清的資料表達式(在分析結果中有多種可能的資料表達式) 如果有多個內置類型的時候大多可以正確分析,但如果有多個用戶定義類型可選,則會拋出錯。

所有類型轉換規則都是建立在下面幾個基本原則上的: