監督學習

監督學習（英語：Supervised learning），又叫有監督學習，監督式學習，是機器學習的一種方法，可以由訓練資料中學到或建立一個模式（函數 / learning model），並依此模式推測新的實例。^[1]訓練資料是由輸入物件（通常是向量）和預期輸出所組成。函數的輸出可以是一個連續的值（稱為迴歸分析），或是預測一個分類標籤（稱作分類）。

一個監督式學習者的任務在觀察完一些事先標記過的訓練範例（輸入和預期輸出）後，去預測這個函數對任何可能出現的輸入的輸出。要達到此目的，學習者必須以"合理"（見歸納偏向）的方式從現有的資料中一般化到非觀察到的情況。在人類和動物感知中，則通常被稱為概念學習（concept learning）。

回顧

監督式學習有兩種形態的模型。最一般的，監督式學習產生一個全域模型，會將輸入物件對應到預期輸出。而另一種，則是將這種對應實作在一個區域模型。（如案例推論及最近鄰居法）。為了解決一個給定的監督式學習的問題（手寫辨識），必須考慮以下步驟：

決定訓練資料的範例的形態。在做其它事前，工程師應決定要使用哪種資料為範例。譬如，可能是一個手寫字元，或一整個手寫的辭彙，或一行手寫文字。
搜集訓練資料。這資料須要具有真實世界的特徵。所以，可以由人類專家或（機器或感測器的）測量中得到輸入物件和其相對應輸出。
決定學習函數的輸入特徵的表示法。學習函數的準確度與輸入的物件如何表示是有很大的關聯度。傳統上，輸入的物件會被轉成一個特徵向量，包含了許多關於描述物件的特徵。因為維數災難的關係，特徵的個數不宜太多，但也要足夠大，才能準確的預測輸出。
決定要學習的函數和其對應的學習演算法所使用的資料結構。譬如，工程師可能選擇類神經網絡和決策樹。
完成設計。工程師接着在搜集到的資料上跑學習演算法。可以藉由將資料跑在資料的子集（稱為驗證集）或交叉驗證（cross-validation）上來調整學習演算法的參數。參數調整後，演算法可以運行在不同於訓練集的測試集上

另外對於監督式學習所使用的辭彙則是分類。現著有着各式的分類器，各自都有強項或弱項。分類器的表現很大程度上地跟要被分類的資料特性有關。並沒有某一單一分類器可以在所有給定的問題上都表現最好，這被稱為『天下沒有白吃的午餐理論』。各式的經驗法則被用來比較分類器的表現及尋找會決定分類器表現的資料特性。決定適合某一問題的分類器仍舊是一項藝術，而非科學。

目前最廣泛被使用的分類器有類神經網絡、支持向量機、最近鄰居法、高斯混合模型、樸素貝葉斯方法、決策樹和徑向基函數分類。

經驗風險最小化

監督式學習的目標是在給定一個 (x, g（x）)的集合下，去找一個函數g。

假設符合g行為的樣本集合是從某個更大甚至是無限的總體中，根據某種未知的概率分佈p，以獨立同分佈隨機變量方式來取樣。則可以假設存在某個跟任務相關的損失函數 L

L:Y\times Y\to \mathbb {R} ^{+}

其中，Y是g的對應域，且L會對應到非負實數（L可能有其它限制）。如果預測出來g的值是z，但實際值是y，而L(z, y)這個量是其間的損失。

某個函數f的風險是定義成損失函數的期望值。如果概率分佈p是離散的（如果是連續的，則可採用定積分和概率密度函數），則定義如下：

R(f)=\sum _{i}L(f(x_{i}),g(x_{i}))\;p(x_{i})

現在的目標則是在一堆可能的函數中去找函數f^*，使其風險R(f^*)是最小的。

然而，既然g的行為已知適用於此有限集合(x₁, y₁), ..., x_n, y_n)，則我們可以求得出真實風險的近似值，譬如，其經驗風險為：

{\tilde {R}}_{n}(f)={\frac {1}{n}}\sum _{i=1}^{n}L(f(x_{i}),y_{i})

選擇會最小化經驗風險的函數f^*就是一般所知的經驗風險最小化原則。統計學習理論則是研究在什麼條件下經驗風險最小化才是可行的，且預斯其近似值將能多好？

主動式學習

一個情況是，有大量尚未標示的資料，但去標示資料則是很耗成本的。一種方法則是，學習演算法會主動去向用戶或老師去詢問標籤。這種形態的監督式學習稱為主動式學習。既然學習者可以選擇例子，學習中要使用到的例子個數通常會比一般的監督式學習來得少。以這種策略則有一個風險是，演算法可能會專注在於一些不重要或不合法的例子。

策略和演算法

應用

常見議題

參考文獻

^ Stuart J. Russell, Peter Norvig (2010) Artificial Intelligence: A Modern Approach, Third Edition, Prentice Hall ISBN 9780136042594.

外部連結

Matlab SUrrogate MOdeling Toolbox - SUMO Toolbox - Matlab code for Active Learning + Model Selection + Supervised Learning (Surrogate Modeling)

[1] Stuart J. Russell, Peter Norvig (2010) Artificial Intelligence: A Modern Approach, Third Edition, Prentice Hall ISBN 9780136042594.

[1]

閱論編電腦科學的主要領域
註：該模板大致遵循ACM 電腦分類系統。
電腦硬件	印刷電路板外部裝置集成電路超大規模集成電路綠色計算電子設計自動化
系統架構組織	電腦系統架構嵌入式系統即時計算
網絡	網絡傳輸協定路由網絡拓撲網絡服務
軟件組織	直譯器中介軟體虛擬機器作業系統軟件質素
軟件符號和工具	程式設計範式程式語言編譯器領域特定語言軟件框架整合式開發環境軟件組態管理函式庫
軟件開發	軟件開發過程需求分析軟件設計軟件部署軟件維護開源模式
計算理論	自動機可計算性理論計算複雜性理論量子計算數值計算方法電腦邏輯形式語意學
演算法	演算法分析演算法設計演算法效率隨機化演算法計算幾何
計算數學	離散數學資訊與計算科學統計學數學軟件數理邏輯集合論數論圖論類型論範疇論資訊論數值分析數學分析
資訊系統	資料庫管理系統電腦數據企業資訊系統社會性軟件地理資訊系統決策支援系統過程控制數據探勘數碼圖書館系統平台數碼行銷萬維網資訊檢索
安全	密碼學形式化方法入侵檢測系統網絡安全資訊保安
人機互動	電腦輔助功能用戶介面可穿戴電腦普適計算虛擬實境聊天機械人
並行性	並行計算平行計算分散式計算多線程多元處理
人工智能	自動推理計算語言學電腦視覺進化計算專家系統自然語言處理機械人學
機器學習	監督式學習無監督學習強化學習交叉驗證
電腦圖學	電腦動畫視覺化彩現修飾相片圖形處理器混合實境虛擬實境圖像處理圖像壓縮實體造型
應用計算	電子商務企業級軟件計算數學計算物理學計算化學計算生物學計算社會科學醫學資訊科學數字藝術電子出版網絡戰電子遊戲文書處理器運籌學教育技術學生物資訊科學認知科學檔案管理系統（英語：Document management system）
分類主題專題維基共用