更正錯誤記憶體

更正錯誤記憶體(英語:Error-Correcting Code memory,縮寫:ECC memoryECC)指能夠實現錯誤檢查和糾正錯誤技術的主記憶體。

ECC RAM 每面均有9枚記憶體顆粒,比普通的多1枚

技術原理

編輯

在ECC技術出現之前,主記憶體中應用最多的另外一種錯誤檢查技術,是奇偶校驗位技術。

數碼電路中,最小的數據單位是「位元(bit)」,也叫「位元」。「位元」也是主記憶體中的最小單位,它是通過「1」和「0」來表示數據高、低電頻訊號。在數字電路中8個連續的位元是一位元組,不帶「奇偶校驗」的主記憶體中的每個位元組只有8位元,若它的某一位儲存出了錯誤,就會使其中儲存的相應數據發生改變而導致應用程式發生錯誤。

而帶有「奇偶校驗」的主記憶體在每一位元組(8位元)外又額外增加了一位用來進行錯誤檢測。比如一個位元組中儲存了某一數值(1、0、1、0、1、0、1、1),把這每一位相加起來(1+0+1+0+1+0+1+1=5)。對於偶校驗,若其結果是奇數,校驗位就定義為1,反之則為0;對於奇校驗則相反。當CPU返回讀取儲存的數據時,它會再次相加前8位元中儲存的數據,計算結果是否與校驗位相一致。當CPU發現二者不同時就會試圖糾正這些錯誤。

但奇偶校驗位技術有個缺點,當主記憶體查到某個數據位有錯誤時,由於不一定能確定錯誤在哪一個位,也就不一定能修正錯誤。所以帶有奇偶校驗的主記憶體的主要功能僅僅是「發現錯誤」,並不能糾正錯誤。

此外,奇偶校驗技術是通過在原來數據位的基礎上增加一個數據位來檢查當前8位元數據的正確性,但隨着數據位的增加,用來檢驗的數據位也成倍增加,就是說當數據位為16位元時它需要增加2位用於檢查,當數據位為32位元時則需增加4位元,依此類推。特別是當數據量非常大時,數據出錯的幾率也就越大,對於只能糾正簡單錯誤的奇偶檢驗的方法就顯得力不從心了。正是基於這樣一種情況,錯誤檢查和糾正(Error Checking and Correcting)應運而生了。

ECC與奇偶校驗不同的是,如果數據位是8位元,則需要增加5位來進行ECC錯誤檢查和糾正。數據位每增加一倍,ECC只增加一位核對位元。也就是說當數據位為16位元時ECC位為6位,32位元時ECC位為7位,數據位為64位元時ECC位為8位元,依此類推。在主記憶體中ECC能夠容許錯誤,並可以將錯誤自動更正,使系統得以正常的操作,不致因錯誤而中斷。

誤解

編輯

部份人認為伺服器必須使用ECC主記憶體,認為ECC主記憶體效能較高,其實是一種謬誤。ECC主記憶體之所以廣泛應用於伺服器領域,並非其效能,而是因為ECC主記憶體的糾錯能力,使伺服器保持穩定。

ECC本身並不是一種主記憶體型號,也不是一種主記憶體專用技術,它是一種廣泛應用於各種領域的電腦中的糾錯技術。

備註

編輯

截止到2020年8月9日,帶ECC校驗的主記憶體還得要電腦其他部件支援才能正常使用,例如主機板和CPU[1](並且可能要在BIOS中進行相應的設置),應用在大多數伺服器CPU和主機板上(一些非伺服器CPU和主機板也支援)。還有,在購買ECC主記憶體時,需注意是ECC UDIMM、ECC RDIMM、ECC LRDIMM、ECC 3DS RDIMM還是其他,因為你的電腦其他部件可能不支援某些種類。

參考文獻

編輯
  1. ^ Server Memory: Types and Performance | Crucial.com. Crucial. [2020-08-09] (美國英語). 

外部連結

編輯