| PostgreSQL 7.4 文檔 | ||||
|---|---|---|---|---|
| Prev | Fast Backward | Fast Forward | Next | |
ANALYZE 收集有關 PostgreSQL 表的內容的統計,然後把結果保存在系統表 pg_statistic 裡。隨後,查詢規劃器就可以使用這些統計幫助判斷查詢的最有效的規劃。
如果沒有參數,ANALYZE 檢查在當前數據庫裡的所有表。 如果有參數,ANALYZE 只檢查那個表。 你還可以給出一列字段名字,這個時候只收集那些字段的統計信息。
週期性地運行 ANALYZE,或者在對表的大部分內容做了更改之後馬上運行它是個好習慣, 準確的統計信息將幫助規劃器選擇最合適的查詢規劃,並因此而改善查詢處理的速度。 一種比較經常採用的策略是每天在低負荷的時候運行一次 VACUUM 和 ANALYZE。
和 VACUUM FULL 不同的是, ANALYZE 只需要在目標表上有一個讀取鎖, 因此它可以和表上的其它活動並行地運行。
收集的統計信息通常包括一個每字段最常用數值的列表以及一個包線圖,顯示每個字段裡數據的近似分布。 如果 ANALYZE 認為它們都沒有什麼用, (比如,在一個唯一鍵字的字段上沒有公共的數值)或者是該字段數據類型不支持相關的操作符, 那麼它們都可以忽略。在 Chapter 21 中有關于統計的更多信息。
對于大表,ANALYZE 採集表內容的一個隨機的抽樣做統計,而不是檢查每一行。 這樣就保證了即使是在很大的表上,我們也只需要很少的一些時間就可以完成分析。 不過,要注意的是統計只是近似的結果,而且每次運行ANALYZE都會導致 EXPLAIN 顯示的規劃器的預期開銷有一些小變化, 即使表內容實際上沒有改變也這樣。在很小的概率的情況下,這個不確定的行為會導致查詢優化器在不同 ANALYZE 之間選擇不同的查詢規劃。為了避免這個問題,可以提高 ANALYZE 收集的統計數量,像下面描述的那樣。
分析的廣度可以通過用調整 default_statistics_target 參變量, 或者是以每字段為基礎通過用 ALTER TABLE ... ALTER COLUMN ... SET STATISTICS (參閱 ALTER TABLE) 設置每字段的統計目標來控制。目標數值設置最常用數值列表中的記錄的最大數目以及包線圖中的最大塊數。 缺省的目標數值是 10,不過我們可以調節這個數值獲取規劃器計算精度和 ANALYZE 運行所需要的時間以及 pg_statistic 裡面佔據的空間數目之間的平衡。 特別是,把統計目標設置為零就關閉了該字段的統計收集。 這麼做對那些從來不參與到查詢的 WHERE,GROUP BY,或者 ORDER BY 子句裡的字段是很有用的,因為規劃器不會使用到這樣的字段上的統計。
在被分析的字段中最大的統計目標決定為統計採樣的表中的行的數目。 增大目標會導致做 ANALYZE 的時候成比例地增大對時間和空間的需求。