數據結構對齊

數據結構對齊是程式編譯後資料在記憶體內的佈局與使用方式。包括三方面內容：數據對齊、數據結構填充（padding）與包入（packing）。

現代計算機CPU一般是以32位元或64位元大小作地址對齊，以32位元架構的計算機舉例,每次以連續的4位元組為一個區間,第一個位元組的位址位在每次CPU抓取資料大小的邊界上,除此之外,如果要訪問的變量沒有對齊，可能會觸發總線錯誤。

當資料小於計算機的字（word）尺寸，可能把幾個資料放在一個字中，稱為包入（packing）。

許多程式語言自動處理數據結構對齊。Ada語言，^[1]^[2] PL/I,^[3] Pascal,^[4] 某些C語言與C++實現, D語言,^[5] Rust,^[6] 與匯編語言允許特別控制對齊的方式。

定義

內存地址a被稱為n字節對齊，a是n的倍數（n應是2的冪），也可以理解為當被訪問的數據長度為n 字節時，數據地址為n字節對齊。如果內存未對齊，稱作misaligned。

內存指針是對齊的，如果它所指的數據是對齊的。指向聚合數據（aggregate data，如struct或數組）是對齊的，若且唯若它的每個組成數據是對齊的。

體系結構

RISC

大多數RISC處理器在加載或存儲指令訪問錯位的地址時，會產生一個對齊錯誤。這允許作業系統使用其他指令來模擬錯位的訪問。例如，對齊錯誤處理程序可以使用字節加載或存儲（其總是對齊的）來模擬更大的加載或存儲指令。

一些架構，如MIPS架構有特殊的無對齊加載和存儲指令。一條無對齊的加載指令從具有最低字節地址的內存字中獲取字節，另一條指令從具有最高字節地址的內存字中獲取字節。同樣的，store-high和store-low指令分別在較高和較低的內存字中存儲相應的字節。

DEC Alpha架構對不對齊的加載和存儲採用了兩步法。第一步是將上層和下層的內存字加載到獨立的寄存器中。第二步是使用類似於MIPS指令的特殊低/高指令來提取或修改內存字。通過將修改後的內存字存儲到內存中，就完成了一個無對齊存儲。造成這種複雜性的原因是，最初的Alpha架構只能讀取或寫入32位或64位的值。這被證明是一個嚴重的限制，經常導致代碼臃腫和性能不佳。為了解決這個限制，在最初的架構中加入了一個名為 "字節字擴展"（BXW）的擴展。它包括字節和字的加載和存儲指令。

因為這些指令比正常的內存加載和存儲指令更大、更慢，所以只有在必要時才可以使用它們。一些C和C++編譯器有一個 "無對齊 "屬性，可以應用於需要無對齊指令的指針。

x86

x86體系架構最初是不要求內存對齊。一些SSE2指令要求數據是128比特(16位元組)對齊。有些CPU指令用於未對齊訪問如MOVDQU。讀寫內存操作僅在對齊時才是原子的。

C語言struct在x86上的對齊

C語言數據結構內的成員按照先後順序在內存中存儲。

默認對齊

結構體中每個成員的類型通常有一個默認的對齊方式，也就是說，除非程式設計師另有要求，否則它將在一個預先確定的邊界上對齊。以下典型的對齊方式對微軟（Visual C++）、Borland/CodeGear（英語：CodeGear）（C++Builder）、Digital Mars（英語：Digital Mars）（DMC）和GNU（GCC）的編譯器在為32位x86編譯時有效。

一個char（一個字節）變量將被1位元組對齊。

一個short（兩個字節）變量將是2位元組對齊的。

一個int（四個字節）變量將是4位元組對齊的。

一個long（四個字節）變量將被4位元組對齊。

一個float（四個字節）變量將是4位元組對齊的。

一個double（8個字節）變量在Windows上是8位元組對齊的，在Linux上是4位元組對齊的（用-malign-double編譯時選項是8位元組）。

一個long long（8個字節）變量將被4位元組對齊。

一個long double（C++Builder和DMC為10個字節，Visual C++為8個字節，GCC為12個字節）變量在C++Builder上將是8位元組對齊，DMC為2位元組對齊，Visual C++為8位元組對齊，GCC為4位元組對齊。

任何指針（四個字節）都將是4位元組對齊的。(例如：char*, int*)

與32位系統相比，LP64 64位系統在對齊方面唯一值得注意的區別是。

一個long（八個字節）變量將是8位元組對齊的。

一個double（8個字節）變量將是8位元組對齊的。

一個long long（8個字節）變量將是8位元組對齊的。

一個long double（在Visual C++中是8個字節，在GCC中是16個字節）變量在Visual C++中是8位元組對齊的，在GCC中是16位元組對齊的。

任何指針（八個字節）變量都將是8位元組對齊的。

有些數據類型取決於實現方式。

指定對齊

一些編譯器（Microsoft,^[7] Borland, GNU,^[8]等等）使用#pragma directive指定對齊的包入（packing）。例如：

#pragma pack(push)  /* push current alignment to stack */
#pragma pack(1)     /* set alignment to 1 byte boundary */

struct MyPackedData
{
    char Data1;
    long Data2;
    char Data3;
};

#pragma pack(pop)   /* restore original alignment from stack */

這個結構在32位系統的大小為6位元組。

缺省packing與#pragma pack

Microsoft編譯器的項目缺省packing(編譯選項/Zp)與#pragma pack指令。#pragma pack指令僅能減少packing尺寸。^[9]

參見

參考文獻

^ Ada Representation Clauses and Pragmas. GNAT Reference Manual 7.4.0w documentation. [2015-08-30]. （原始內容存檔於2015-10-13）.
^ F.8 Representation Clauses. SPARCompiler Ada Programmer's Guide (PDF). [2015-08-30]. （原始內容存檔 (PDF)於2021-12-16）.
^ IBM System/360 Operating System PL/I Language Specifications (PDF). IBM. July 1966: 55–56 [2017-11-21]. C28-6571-3. （原始內容存檔 (PDF)於2019-05-29）.
^ Niklaus Wirth. The Programming Language Pascal (Revised Report) (PDF): 12. July 1973 [2017-11-21]. （原始內容 (PDF)存檔於2015-03-15）.
^ Attributes - D Programming Language: Align Attribute. [2012-04-13]. （原始內容存檔於2012-04-09）.
^ The Rustonomicon - Alternative Representations. [2016-06-19]. （原始內容存檔於2016-05-09）.
^ pack. [2017-11-21]. （原始內容存檔於2017-03-28）.
^ 6.58.8 Structure-Packing Pragmas. [2017-11-21]. （原始內容存檔於2017-01-08）.
^ Working with Packing Structures. MSDN Library. Microsoft. 2007-07-09 [2011-01-11]. （原始內容存檔於2012-10-18）.

Bryant, Randal E.; David, O'Hallaron. Computer Systems: A Programmer's Perspective 2003. Upper Saddle River, NJ: Pearson Education. 2003 [2017-11-21]. ISBN 0-13-034074-X. （原始內容存檔於2007-08-06）.

外部連結

[1] Ada Representation Clauses and Pragmas. GNAT Reference Manual 7.4.0w documentation. [2015-08-30]. （原始內容存檔於2015-10-13）.

[2] F.8 Representation Clauses. SPARCompiler Ada Programmer's Guide (PDF). [2015-08-30]. （原始內容存檔 (PDF)於2021-12-16）.

[3] IBM System/360 Operating System PL/I Language Specifications (PDF). IBM. July 1966: 55–56 [2017-11-21]. C28-6571-3. （原始內容存檔 (PDF)於2019-05-29）.

[4] Niklaus Wirth. The Programming Language Pascal (Revised Report) (PDF): 12. July 1973 [2017-11-21]. （原始內容 (PDF)存檔於2015-03-15）.

[5] Attributes - D Programming Language: Align Attribute. [2012-04-13]. （原始內容存檔於2012-04-09）.

[6] The Rustonomicon - Alternative Representations. [2016-06-19]. （原始內容存檔於2016-05-09）.

[7] . [2017-11-21]. （原始內容存檔於2017-03-28）.

[8] 6.58.8 Structure-Packing Pragmas. [2017-11-21]. （原始內容存檔於2017-01-08）.

[9] Working with Packing Structures. MSDN Library. Microsoft. 2007-07-09 [2011-01-11]. （原始內容存檔於2012-10-18）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]