| PostgreSQL 7.4 文檔 | ||||
|---|---|---|---|---|
| Prev | Fast Backward | Chapter 9. 函數和操作符 | Fast Forward | Next |
本節描述了用于檢查和操作字符串數值的函數和操作符. 在這個環境中的字串包括所有類型 character, character varying,和 text 的值.除非另外說明,所有下面列出的函數都可以處理這些類型, 不過要小心的是,在使用 character 類型的時候, 它的自動填充的潛在影響.通常這裡描述的函數也能用于非字串 類型,我們只要先把那些數據轉化為字串表現形式就可以了。 有些函數還可以處理位串類型.
SQL 定義了一些字串函數, 它們有指定的語法,它們裡面是用 某種特定的關鍵字,而不是逗號來分隔參數. 詳情請見Table 9-6, 這些函數也用正常的函數調用說法實現了. (參閱 Table 9-7.)
Table 9-6. SQL 字串函數和操作符
| 函數 | 返回類型 | 描述 | 例子 | 結果 |
|---|---|---|---|---|
| string || string | text | 字串連接 | 'Post' || 'greSQL' | PostgreSQL |
| bit_length(string) | integer | 字串裡二進制位的個數 | bit_length('jose') | 32 |
| char_length(string) 或 character_length(string) | integer | 字串中的字符個數 | char_length('jose') | 4 |
| convert(string using conversion_name) | text | 使用指定的轉換名字改變編碼。轉換可以通過 CREATE CONVERSION 定義。當然系統裡有一些預定義的轉換名字。參閱 Table 9-8 獲取可用的轉換名。 | convert('PostgreSQL' using iso_8859_1_to_utf_8) | Unicode (UTF-8) 編碼的'PostgreSQL' |
| lower(string) | text | 把字串轉化為小寫 | lower('TOM') | tom |
| octet_length(string) | integer | 字串中的字節數 | octet_length('jose') | 4 |
| position(substring in string) | integer | 聲明的子字串的位置 | position('om' in 'Thomas') | 3 |
| overlay(string placing string from integer [for integer]) | text | 替換子字串 | overlay('Txxxxas' placing 'hom' from 2 for 4) | Thomas |
| position(substring in string) | integer | 指定的子字串的位置 | position('om' in 'Thomas') | 3 |
| substring(string [from integer] [for integer]) | text | 抽取子字串 | substring('Thomas' from 2 for 3) | hom |
| substring(string from pattern) | text | 抽取匹配 POSIX 正則表達式的子字串 | substring('Thomas' from '...$') | mas |
| substring(string from pattern for escape) | text | 抽取匹配SQL正則表達式的子字串 | substring('Thomas' from '%#"o_a#"_' for '#') | oma |
| trim([leading | trailing | both] [characters] from string) | text | 從字串 string 的 開頭/結尾/兩邊/ 刪除只包含 characters (缺省是一個空白)的最長的字串. | trim(both 'x' from 'xTomxx') | Tom |
| upper(string) | text | 把字串轉化為大寫. | upper('tom') | TOM |
還有額外的字串操作函數可以用,它們在Table 9-7列出. 它們有些在內部用于實現Table 9-6列出的SQL標準字串函數.
Table 9-7. 其他字串函數
| 函數 | 返回類型 | 描述 | 例子 | 結果 |
|---|---|---|---|---|
| ascii(text) | integer | 參數第一個字符的 ASCII 碼 | ascii('x') | 120 |
| btrim(string text, characters text) | text | 從 string 開頭和結尾刪除 只包含在 characters 裡的字符的最長字串. | btrim('xyxtrimyyx','xy') | trim |
| chr(integer) | text | 給出 ASCII 碼的字符 | chr(65) | A |
| convert(string text, [src_encoding name,] dest_encoding name) | text | 把字串轉換為 dest_encoding . 原來的編碼是用 src_encoding 聲明的. 如果省略了 src_encoding, 則假設為數據庫編碼. | convert('text_in_unicode', 'UNICODE', 'LATIN1') | 以 ISO 8859-1 編碼表示的text_in_unicode |
| decode(string text, type text) | bytea | 把早先用encode編碼的,存放在 string 裡面的二進制數據解碼。 參數類型和encode一樣。 | decode('MTIzAAE=', 'base64') | 123\000\001 |
| encode(data bytea, type text) | text | 把二進制數據編碼為只包含 ASCII 形式的數據。 支持的類型有base64,hex,escape。 | encode('123\\000\\001', 'base64') | MTIzAAE= |
| initcap(text) | text | 把每個單詞(空白分隔)的第一個子母轉為大寫 | initcap('hi thomas') | Hi Thomas |
| length(string) | integer | 字串中字符的數目 | length('jose') | 4 |
| lpad(string text, length integer [, fill text]) | text | 通過填充字符 fill (缺省時為空白), 把 string 填充為長度 length. 如果 string 已經比 length 長則將其截斷(在右邊). | lpad('hi', 5, 'xy') | xyxhi |
| ltrim(string text, characters text) | text | 從字串 string 的 開頭 刪除只包含 characters 的最長的字串. | ltrim('zzzytrim','xyz') | trim |
| md5(string text) | text | 計算給出字串的 MD5 散列,以十六進制返回結果。 | md5('abc') | 900150983cd24fb0d6963f7d28e17f72 |
| pg_client_encoding() | name | 當前客戶端編碼名稱. | pg_client_encoding() | SQL_ASCII |
| quote_ident(string text) | text | 返回給出字串的一個適用于在SQL語句字串裡當作標識符引起使用的形式。 只有在必要的時候才會添加引號(也就是說,如果字串包含非標識符字符或者會 轉換大小寫的字符)。 嵌入的引號被恰當地寫了雙份。 | quote_ident('Foo') | "Foo" |
| quote_literal(string text) | text | 返回給出字串的一個適用于在SQL語句字串裡當作文本使用的形式。 嵌入的引號和反斜槓被恰當地寫了雙份。 | quote_literal('O\'Reilly') | 'O''Reilly' |
| repeat(text, integer) | text | 重復 text 一定次數. | repeat('Pg', 4) | PgPgPgPg |
| replace(string text, from text, to text) | text | 把字串string裡出現地所有子字串 from 替換成子字串 to。 | replace('abcdefabcdef', 'cd', 'XX') | abXXefabXXef |
| rpad(string text, length integer [, fill text]) | text | 通過填充字符 fill (缺省時為空白), 把 string 填充為長度 length. 如果 string 已經比 length 長則將其截斷. | rpad('hi', 5, 'xy') | hixyx |
| rtrim(string text, character text) | text | 從字串 string 的 結尾 刪除只包含 character 的最長的字串. | rtrim('trimxxxx','x') | trim |
| split_part(string text, delimiter text, field integer) | text | 根據 delimiter 分隔 string 返回生成的第 field 個子字串(一為基)。 | split_part('abc~@~def~@~ghi','~@~',2) | def |
| strpos(string, substring) | text | 聲明的子字串的位置.(和 position(substring in string一樣),不過要注意參數順序 是相反的) | strpos('high','ig') | 2 |
| substr(string, from [, count]) | text | 抽取子字串.(和 substring(string from from for count)一樣) | substr('alphabet', 3, 2) | ph |
| to_ascii(text [, encoding]) | text | 把文本從其它編碼轉換為 ASCII. [a] | to_ascii('Karel') | Karel |
| to_hex(number integer 或者 bigint) | text | 把 number 轉換成其對應地十六進制表現形式。 | to_hex(9223372036854775807) | 7fffffffffffffff |
| translate(string text, from text, to text) | text | 把在 string 中包含的任何匹配 from 中的字符的字符轉化為對應的 在 to 中的字符. | translate('12345', '14', 'ax') | a23x5 |
| Notes: a. to_ascii 函數只支持從 LATIN1, LATIN2,和 WIN1250 轉換。 | ||||
Table 9-8. 內置的轉換
| 轉換名 [a] | 源編碼 | 目的編碼 |
|---|---|---|
| ascii_to_mic | SQL_ASCII | MULE_INTERNAL |
| ascii_to_utf_8 | SQL_ASCII | UNICODE |
| big5_to_euc_tw | BIG5 | EUC_TW |
| big5_to_mic | BIG5 | MULE_INTERNAL |
| big5_to_utf_8 | BIG5 | UNICODE |
| euc_cn_to_mic | EUC_CN | MULE_INTERNAL |
| euc_cn_to_utf_8 | EUC_CN | UNICODE |
| euc_jp_to_mic | EUC_JP | MULE_INTERNAL |
| euc_jp_to_sjis | EUC_JP | SJIS |
| euc_jp_to_utf_8 | EUC_JP | UNICODE |
| euc_kr_to_mic | EUC_KR | MULE_INTERNAL |
| euc_kr_to_utf_8 | EUC_KR | UNICODE |
| euc_tw_to_big5 | EUC_TW | BIG5 |
| euc_tw_to_mic | EUC_TW | MULE_INTERNAL |
| euc_tw_to_utf_8 | EUC_TW | UNICODE |
| gb18030_to_utf_8 | GB18030 | UNICODE |
| gbk_to_utf_8 | GBK | UNICODE |
| iso_8859_10_to_utf_8 | LATIN6 | UNICODE |
| iso_8859_13_to_utf_8 | LATIN7 | UNICODE |
| iso_8859_14_to_utf_8 | LATIN8 | UNICODE |
| iso_8859_15_to_utf_8 | LATIN9 | UNICODE |
| iso_8859_16_to_utf_8 | LATIN10 | UNICODE |
| iso_8859_1_to_mic | LATIN1 | MULE_INTERNAL |
| iso_8859_1_to_utf_8 | LATIN1 | UNICODE |
| iso_8859_2_to_mic | LATIN2 | MULE_INTERNAL |
| iso_8859_2_to_utf_8 | LATIN2 | UNICODE |
| iso_8859_2_to_windows_1250 | LATIN2 | WIN1250 |
| iso_8859_3_to_mic | LATIN3 | MULE_INTERNAL |
| iso_8859_3_to_utf_8 | LATIN3 | UNICODE |
| iso_8859_4_to_mic | LATIN4 | MULE_INTERNAL |
| iso_8859_4_to_utf_8 | LATIN4 | UNICODE |
| iso_8859_5_to_koi8_r | ISO_8859_5 | KOI8 |
| iso_8859_5_to_mic | ISO_8859_5 | MULE_INTERNAL |
| iso_8859_5_to_utf_8 | ISO_8859_5 | UNICODE |
| iso_8859_5_to_windows_1251 | ISO_8859_5 | WIN |
| iso_8859_5_to_windows_866 | ISO_8859_5 | ALT |
| iso_8859_6_to_utf_8 | ISO_8859_6 | UNICODE |
| iso_8859_7_to_utf_8 | ISO_8859_7 | UNICODE |
| iso_8859_8_to_utf_8 | ISO_8859_8 | UNICODE |
| iso_8859_9_to_utf_8 | LATIN5 | UNICODE |
| johab_to_utf_8 | JOHAB | UNICODE |
| koi8_r_to_iso_8859_5 | KOI8 | ISO_8859_5 |
| koi8_r_to_mic | KOI8 | MULE_INTERNAL |
| koi8_r_to_utf_8 | KOI8 | UNICODE |
| koi8_r_to_windows_1251 | KOI8 | WIN |
| koi8_r_to_windows_866 | KOI8 | ALT |
| mic_to_ascii | MULE_INTERNAL | SQL_ASCII |
| mic_to_big5 | MULE_INTERNAL | BIG5 |
| mic_to_euc_cn | MULE_INTERNAL | EUC_CN |
| mic_to_euc_jp | MULE_INTERNAL | EUC_JP |
| mic_to_euc_kr | MULE_INTERNAL | EUC_KR |
| mic_to_euc_tw | MULE_INTERNAL | EUC_TW |
| mic_to_iso_8859_1 | MULE_INTERNAL | LATIN1 |
| mic_to_iso_8859_2 | MULE_INTERNAL | LATIN2 |
| mic_to_iso_8859_3 | MULE_INTERNAL | LATIN3 |
| mic_to_iso_8859_4 | MULE_INTERNAL | LATIN4 |
| mic_to_iso_8859_5 | MULE_INTERNAL | ISO_8859_5 |
| mic_to_koi8_r | MULE_INTERNAL | KOI8 |
| mic_to_sjis | MULE_INTERNAL | SJIS |
| mic_to_windows_1250 | MULE_INTERNAL | WIN1250 |
| mic_to_windows_1251 | MULE_INTERNAL | WIN |
| mic_to_windows_866 | MULE_INTERNAL | ALT |
| sjis_to_euc_jp | SJIS | EUC_JP |
| sjis_to_mic | SJIS | MULE_INTERNAL |
| sjis_to_utf_8 | SJIS | UNICODE |
| tcvn_to_utf_8 | TCVN | UNICODE |
| uhc_to_utf_8 | UHC | UNICODE |
| utf_8_to_ascii | UNICODE | SQL_ASCII |
| utf_8_to_big5 | UNICODE | BIG5 |
| utf_8_to_euc_cn | UNICODE | EUC_CN |
| utf_8_to_euc_jp | UNICODE | EUC_JP |
| utf_8_to_euc_kr | UNICODE | EUC_KR |
| utf_8_to_euc_tw | UNICODE | EUC_TW |
| utf_8_to_gb18030 | UNICODE | GB18030 |
| utf_8_to_gbk | UNICODE | GBK |
| utf_8_to_iso_8859_1 | UNICODE | LATIN1 |
| utf_8_to_iso_8859_10 | UNICODE | LATIN6 |
| utf_8_to_iso_8859_13 | UNICODE | LATIN7 |
| utf_8_to_iso_8859_14 | UNICODE | LATIN8 |
| utf_8_to_iso_8859_15 | UNICODE | LATIN9 |
| utf_8_to_iso_8859_16 | UNICODE | LATIN10 |
| utf_8_to_iso_8859_2 | UNICODE | LATIN2 |
| utf_8_to_iso_8859_3 | UNICODE | LATIN3 |
| utf_8_to_iso_8859_4 | UNICODE | LATIN4 |
| utf_8_to_iso_8859_5 | UNICODE | ISO_8859_5 |
| utf_8_to_iso_8859_6 | UNICODE | ISO_8859_6 |
| utf_8_to_iso_8859_7 | UNICODE | ISO_8859_7 |
| utf_8_to_iso_8859_8 | UNICODE | ISO_8859_8 |
| utf_8_to_iso_8859_9 | UNICODE | LATIN5 |
| utf_8_to_johab | UNICODE | JOHAB |
| utf_8_to_koi8_r | UNICODE | KOI8 |
| utf_8_to_sjis | UNICODE | SJIS |
| utf_8_to_tcvn | UNICODE | TCVN |
| utf_8_to_uhc | UNICODE | UHC |
| utf_8_to_windows_1250 | UNICODE | WIN1250 |
| utf_8_to_windows_1251 | UNICODE | WIN |
| utf_8_to_windows_1256 | UNICODE | WIN1256 |
| utf_8_to_windows_866 | UNICODE | ALT |
| utf_8_to_windows_874 | UNICODE | WIN874 |
| windows_1250_to_iso_8859_2 | WIN1250 | LATIN2 |
| windows_1250_to_mic | WIN1250 | MULE_INTERNAL |
| windows_1250_to_utf_8 | WIN1250 | UNICODE |
| windows_1251_to_iso_8859_5 | WIN | ISO_8859_5 |
| windows_1251_to_koi8_r | WIN | KOI8 |
| windows_1251_to_mic | WIN | MULE_INTERNAL |
| windows_1251_to_utf_8 | WIN | UNICODE |
| windows_1251_to_windows_866 | WIN | ALT |
| windows_1256_to_utf_8 | WIN1256 | UNICODE |
| windows_866_to_iso_8859_5 | ALT | ISO_8859_5 |
| windows_866_to_koi8_r | ALT | KOI8 |
| windows_866_to_mic | ALT | MULE_INTERNAL |
| windows_866_to_utf_8 | ALT | UNICODE |
| windows_866_to_windows_1251 | ALT | WIN |
| windows_874_to_utf_8 | WIN874 | UNICODE |
| Notes: a. 轉換名遵循一個標準的命名模式:將源編碼中的所有非字母數字字符 用下劃線替換,後面跟著 _to_,然後後面再跟著 經過同樣處理的目標編碼的名字。因此這些名字可能和客戶的編碼名字 不同。 | ||