凸函數(英文:Convex function)是指函數圖形上,任意兩點連成的線段,皆位於圖形的上方的實值函數[1]如單變數的二次函數指數函數。二階可導的一元函數為凸,若且唯若其定義域為凸集,且函數的二階導數在整個定義域上非負。直觀理解,凸函數的圖像形如開口向上的杯,而相反,凹函數則形如開口向下的帽

凸函數的圖像上任取兩點,連成的線段必在圖像上方。
二元二次多項式函數的圖像,形如開口向上的碗。

最優化研究中,凸函數的最小化問題有唯一性,即凸開集上的嚴格凸函數,至多只有一個極小值。

概率論中,凸函數作用在某隨機變量期望值所得的結果,總不大於對隨機變量先取函數值再取期望,即

稱為延森不等式。該不等式可以推導出均值不等式赫爾德不等式等結果。

定義

編輯
形像理解凸函數與延森不等式

 為某向量空間凸子集,若實值函數  對任意  及任意 ,皆有

 

  稱為凸函數

  ,然後在   圖像上任取兩點   連線,則連線上某點    座標可以想成從   出發,前進了   這整段的一部分而已,也就是說

 

循著同樣的比例     座標就可以寫成

 

但同樣的   座標下,對應的   函數值就是

 

所以,凸函數的定義意為,  的圖像上,任意相異兩點的連線不能低於中間  的曲線。[2]換言之,函數的上境圖英語Epigraph (mathematics)(圖像上方的點的集合)為凸集

嚴格凸函數

編輯

若將定義的 號換成 ,則得到嚴格凸的定義:

 稱為嚴格凸,意思是對 和任意不相等的 ,皆有

 

  ,在嚴格凸函數 的圖像曲線上,任意兩相異點的連線,除端點外皆高於曲線。

幾乎凸函數

編輯

 實值函數  對於任意三實數   ,都有 ,則稱  幾乎凸的。

性質

編輯

凸函數的某些性質,多元情況的敍述與一元情況同樣簡單。此種性質,可能僅於多元情況列舉,恕不在一元情況贅述。

一元情況

編輯
 
函數(藍色)是凸的,若且唯若其上方的區域(綠色)是一個凸集
  •  是一元實函數定義域區間。考慮割線斜率 則函數 對稱函數粵語對稱函數,即關於  為凸,當且僅當對每個固定的 ,皆有 關於 單調不減(或由對稱性,可將此句中 互換)。此刻劃有助證明以下的結果。
  • 若一元凸函數 定義在開區間 內,則在C連續,且處處有左側及右側的單邊導數英語Semi-differentiability。如此定義的兩個單邊導函數,皆為單調不減。由此推出,除可數個點外, 在其他點皆可微(不過不可導的點組成的集合,仍有可能稠密)。如果 閉區間,那麼 有可能在 的端點不連續,見例子
  • 一元可微函數在區間上是凸的,若且唯若函數位於所有它的切線的上方:[3]:69對於區間內的所有  ,都有 特別地,如果 ,則上式化為 ,故  最小值
  • 一元可微函數在某個區間上是凸的,若且唯若它的導數在該區間上單調不減。若一元函數既凸又可導,則其導數也連續
  • 一元二階可微的函數在區間上是凸的,若且唯若它的二階導數英語second derivative是非負的;這是判斷某個函數是否凸的實用方法。直觀地,二階可導的凸函數「向上彎」,而不會屈向另一邊(即無拐點)。如果它的二階導數是正數,那麼函數就是嚴格凸的,但反過來不成立。例如, 的二階導數是 ,當 時為零,但 是嚴格凸的。
    • 此性質的條件「二階導數非負」與前一個性質的條件「導數單調不減」有差異。若 在區間 非負,則的確  單調不減。反之則不然,因為可能有  單調不減,但在某點不可導,即  中某點無定義。
  •  為一元凸函數,且 ,則 正數集內為超可加函數英語Superadditivity,即 對任意正實數 成立。

多元情況

編輯

更一般地,多元二次可微的連續函數在凸集上是凸的,若且唯若它的黑塞矩陣在凸集的內部是半正定的。

凸函數的任何極小值也是最小值。嚴格凸函數最多有一個最小值。

對於凸函數f水平子集{x | f(x) < a}和{x | f(x) ≤ a}(aR)是凸集。然而,水平子集是凸集的函數不一定是凸函數;這樣的函數稱為擬凸函數

延森不等式對於每一個凸函數f都成立。如果 是一個隨機變量,在f的定義域內取值,那麼 (在這裡, 表示數學期望。)

凸函數的初等運算

編輯
  • 如果  是凸函數,那麼  也是凸函數。
  • 如果  是凸函數,且 遞增,那麼 是凸函數。
  • 凸性在仿射映射下不變:也就是說,如果 是凸函數( ),那麼 也是凸函數,其中 
  • 如果  內是凸函數,且 是一個凸的非空集,那麼  內是凸函數,只要對於某個 ,有 

例子

編輯
  • 函數 處處有 ,因此f是一個(嚴格的)凸函數。
  • 絕對值函數 是凸函數,雖然它在點x = 0沒有導數。
  •  時,函數 是凸函數。
  • 定義域為[0,1]的函數f,定義為f(0)=f(1)=1,當0<x<1時f(x)=0,是凸函數;它在開區間(0,1)內連續,但在0和1不連續。
  • 函數 的二階導數為 ,因此它在x ≥ 0的集合上是凸函數,在x ≤ 0的集合上是凹函數
  • 每一個在 內取值的線性變換都是凸函數,但不是嚴格凸函數,因為如果f是線性函數,那麼 。如果將「凸」替換為「凹」,該命題也成立。
  • 每一個在 內取值的仿射變換,也就是說,每一個形如 的函數,既是凸函數又是凹函數。
  • 每一個範數都是凸函數,這是由於三角不等式
  • 如果 是凸函數,那麼當 時, 是凸函數。
  •   單調遞增但非凸的函數。
  • 函數f(x) = 1/x2f(0)=+∞,在區間(0,+∞)內是凸函數,在區間(-∞,0)內也是凸函數,但是在區間(-∞,+∞)內不是凸函數,這是由於x = 0處的奇點。

參見

編輯

參考文獻

編輯
  1. ^ 36-705 Intermediate Statistics: Lecture Notes 2 [中級統計學:講義2] (PDF). www.stat.cmu.edu. [3 March 2017]. (原始內容存檔 (PDF)於2021-05-06) (英語). 
  2. ^ Concave Upward and Downward [上凸與下凸]. mathsisfun.com. (原始內容存檔於2013-12-18) (英語). 
  3. ^ Boyd, Stephen P.; Vandenberghe, Lieven. Convex Optimization [凸優化] (pdf). Cambridge University Press. 2004 [October 15, 2011]. ISBN 978-0-521-83378-3. (原始內容存檔 (PDF)於2021-05-09) (英語). 
  • Moon, Todd. Tutorial: Convexity and Jensen's inequality. [2008-09-04]. (原始內容存檔於2008-04-20). 
  • Rockafellar, R. T. Convex analysis. Princeton: Princeton University Press. 1970. 
  • Luenberger, David. Linear and Nonlinear Programming. Addison-Wesley. 1984. 
  • Luenberger, David. Optimization by Vector Space Methods. Wiley & Sons. 1969. 
  • Bertsekas, Dimitri. Convex Analysis and Optimization. Athena Scientific. 2003. 
  • Thomson, Brian. Symmetric Properties of Real Functions. CRC Press. 1994. 
  • Hiriart-Urruty, Jean-Baptiste, and Lemaréchal, Claude. (2004). Fundamentals of Convex analysis. Berlin: Springer.
  • Krasnosel'skii M.A., Rutickii Ya.B. Convex Functions and Orlicz Spaces. Groningen: P.Noordhoff Ltd. 1961. 
  • Borwein, Jonathan, and Lewis, Adrian. (2000). Convex Analysis and Nonlinear Optimization. Springer.