dd (Unix)

Unix與類Unix作業系統上的指令

dd是一個Unix類Unix系統上的命令,主要功能為轉換和複製檔案。[1]

在Unix上,硬體的裝置驅動(如硬碟)和特殊裝置檔案(如/dev/zero/dev/random)就像普通檔案一樣,出現在檔案系統中;只要在各自的驅動程式中實現了對應的功能,dd也可以讀取自和/或寫入到這些檔案。這樣,dd也可以用在備份硬體的引導磁區、取得一定數量的亂數據等任務中。dd程式也可以在複製時處理資料,例如轉換位元組序、或在ASCIIEBCDIC編碼間互換。[2]

dd的名字可能來源於IBM工作控制語言(JCL)中的DD語句,[3]意為「Data Description」(資料描述)的縮寫。[4]該命令的語句與JCL中的相似,而與其他Unix命令較不同,因此這可能是個玩笑。[3]另一種解釋是「cc」(根據命令自身的描述,為「convert and copy」(轉換和複製))已經被C語言編譯器(C compiler)所占。[來源請求]

dd命令由單一UNIX規範的一部分,IEEE標準1003.1-2008所規定。

用法

編輯

dd命令列語句與其他的Unix程式不同,因為它的命令列選項格式為选项=,而不是更標準的--选项 值-选项=dd預設從標準輸入中讀取,並寫入到標準輸出中,但可以用選項if(input file,輸入檔案)和of(output file,輸出檔案)改變。

由於作業系統的不同,用法會有出入。另外,dd的一些特定功能取決於電腦系統的能力,例如直接訪問主記憶體。向執行中的dd行程傳送SIGINFO訊號(Linux上為USR1)可以使它將I/O統計資訊列印到標準錯誤一次,然後繼續複製(注意在OS X上,訊號可能導致行程終止)。dd可以從鍵盤中讀取標準輸入。到達檔案結尾時,dd將會退出。訊號和EOF是由軟體決定。例如,移植到Windows的Unix工具使用不同的EOF:Cygwin使用<ctrl-d> (通常的Unix EOF),而MKS工具箱使用<ctrl-z>(通常的Windows EOF)。

正如Unix哲學一樣,dd只做好一件事(並被認為做得「好」)。與複雜的和高度抽象的實用程式不同,除了為不同的選項做底層決定,dd沒有其它的演算法。一般在每一次執行時,會改變dd的選項以分步處理一個電腦問題。

輸出訊息

編輯

Linux上GNU coreutils提供的變種沒有描述執行結束時,dd輸出到標準輸出訊息的格式。然而,其他的實現描述了它,例如BSD上的。

「記錄讀入」和「記錄寫出」行顯示了已完整傳輸的塊數+不完整的塊數,例如物理媒介以不完整的塊結尾,或是一個物理錯誤使得一個完整的塊無法被讀取。

塊大小

編輯

是衡量一次讀取、寫入和轉換位元組的單位。命令列選項可以為輸入/讀取(ibs)和輸出/寫入(obs)指定一個不同的塊大小,儘管塊大小(bs)選項會覆蓋ibsobs選項。輸入和輸出的預設塊大小為512位元組(傳統的磁碟塊及POSIX規定的「塊」大小)複製的count選項、讀取的skip選項和寫入的seek選項都是以塊為單位。轉換操作也受「轉換塊大小」(cbs)影響。

dd的一些用途中,塊大小可能會影響表現。例如,當轉換硬碟中資料時,較小的塊大小通常會導致更多的位元組被轉換。發出許多小塊的讀取是一種開銷的浪費,且可能會對執行效能有負面影響。較大的塊大小可能會提高複製速度。但是,由於要複製的位元組量是由bs×count給出的,因此不可能在一次dd命令中複製素數個位元組,除非使用兩個糟糕選項之一:bs=N count=1(消耗主記憶體)或bs=1 count=N(大量讀請求開銷)。替代程式(見下文)允許指定位元組,而不是塊。在用作網路傳輸時,根據使用的網路協定,塊大小可能會與大小衝突。

提供給塊大小的值會被解釋成十進制整數,也可以加入字尾指定倍數。字尾w表示2倍,b表示512倍,k表示1024倍,M表示1024 × 1024倍,G表示1024 × 1024 × 1024倍,等等。另外,在塊大小和計數參數中,一些實現也可以使用x表示乘運算。

例如,塊大小bs=2x80x18b表示2 × 80 × 18 × 512 = 1474560位元組,也就是一張1440 KiB軟碟的確切大小。

用途

編輯

dd命令可用於各種用途。

資料轉換

編輯

dd可以在檔案、裝置、分割區和卷之間複製資料。資料可以從其中任何地方輸入或輸出;但輸出到分割區時有重要差異。此外在傳輸過程中,資料可以用conv選項修改以適應媒介。

如果最後一個塊有意外長度,試圖使用cp複製整個磁碟可能會忽略掉它[來源請求];然而dd卻可能成功。源和目標磁碟應該具有相同的大小。

不同情況的dd格式
dd if=/dev/sr0 of=myCD.iso bs=2048 conv=noerror,sync 從CD-ROM中建立ISO磁碟鏡像
dd if=/dev/sda2 of=/dev/sdb2 bs=4096 conv=noerror 克隆一個分割區到另一個。
dd if=/dev/ad0 of=/dev/ad1 bs=1M conv=noerror 克隆硬碟「ad0」到「ad1」。

noerror選項意味著如果發生錯誤,程式也將繼續執行。sync選項表示填充每個塊到指定位元組。

備份和恢復主開機紀錄

編輯

可以修復主開機紀錄。主開機紀錄可以轉移到檔案,或從中轉移出來。

要複製軟碟的前兩個磁區:

dd if=/dev/fd0 of=MBRboot.img bs=512 count=2

要建立整個x86主開機紀錄的鏡像(包括MS-DOS分割區表和MBR魔法位元組):

dd if=/dev/sda of=MBR.img bs=512 count=1

要建立僅含主開機紀錄引導代碼的鏡像(不包括分割區表和開機所需的魔法位元組):

dd if=/dev/sda of=MBR_boot.img bs=446 count=1

資料修改

編輯

dd可以原地修改資料。

用空位元組覆蓋檔案的前512個位元組:

dd if=/dev/zero of=path/to/file bs=512 count=1 conv=notrunc

轉換選項notrunc意味著不縮減輸出檔案,也就是說,如果輸出檔案已經存在,只改變指定的位元組,然後退出,並保留輸出檔案的剩餘部分。沒有這個選項,dd將建立一個512位元組長的檔案。

在不同的分割區中複製磁碟分割區到磁碟映像檔案中:

dd if=/dev/sdb2 of=partition.image bs=4096 conv=noerror

磁碟擦除

編輯

出於安全方面的考慮,有時需要擦除丟棄的磁碟。

檢查驅動器上是否有資料,並將其輸出到標準輸出:

dd if=/dev/sda

用零擦除磁碟:

dd if=/dev/zero of=/dev/sda bs=4k

相較於上面資料修改的例子,不需要使用轉換選項notrunc,因為當dd的輸出檔案為塊裝置時,它沒有效果。[5]

bs=4k選項使dd一次讀取或寫入4千位元組。在現代系統中,由於傳輸容量(如RAID系統),一個更大的塊大小可能更有利。注意用亂數據填充磁碟總是比用零慢的多,因為亂數據必須先由CPU和/或HWRNG生成,且不同的設計有不同的效能特點。(後面PRNG的/dev/urandom可能比libc中的要慢。)在大多數較現代的磁碟中,用零擦除會使其中的資料永久遺失。[6]

用零擦除磁碟會使它的資料無法被軟體恢復。然而資料仍可能用特殊的實驗室技術恢復。

shred程式提供了完成相同任務的替代方法,最後,目前許多Linux發行版還提供了一個精心製作的工具wipe[7](做得「好」,如上面的Unix哲學),提供了更多方法擦除。

資料恢復

編輯

1984年,GNU dd開啟了開源軟體(OSS)恢復資料、檔案、驅動器和分割區的歷史。dd行程一次處理一個塊,它的演算法只是在使用者介面顯示執行狀態。1999年10月,一個C語言的程式dd_rescue發布了。它的演算法一次能處理兩個塊。但改進dd_rescue的資料恢復演算法、2003年的shell指令碼dd_rhelp作者現在推薦GNU ddrescue[8]它是一個發布於2004年的C++程式,與大多數的Linux發行版一起發行。在開源軟體中,GNU ddrescue有最先進的塊大小變換演算法。[9]ddrescuedd_rescue儘管名字相近,但卻是不同的程式。因為如此,區分更為明確的備用名稱也有使用;使用的名稱有「addrescue」(freecode.com),「gddrescue」(Debian包名)和「gnu_ddrescue」(openSUSE包名)。)

GNU ddrescue既穩定又安全。[10]

另一個開源程式savehd7使用更複雜的演算法,但它需要安裝自己的語言直譯器。

驅動器效能基準測試

編輯

對驅動器進行基準測試(通常是單執行緒),使用1024位元組塊分析連續系統讀取和寫入的效能:

dd if=/dev/zero bs=1024 count=1000000 of=file_1GB
dd if=file_1GB of=/dev/null bs=1024

用亂數據生成檔案

編輯

使用核心亂數驅動,用100個隨機位元組生成檔案:

dd if=/dev/urandom of=myrandom bs=100 count=1

將檔案轉換為大寫

編輯

將檔案轉換為大寫:

dd if=filename of=filename1 conv=ucase

建立任意大小的空檔案

編輯

建立1GiB的稀疏檔案,或增加現有檔案的大小:

dd if=/dev/zero of=mytestfile.out bs=1 count=0 seek=1G

(更先進的工具是GNU coreutils中的fallocatetruncate。)

局限

編輯

希捷的文件警告說,「一些依賴底層硬碟訪問的硬碟工具(如DD)可能不支援48位元邏輯區塊位址(LBA),除非進行升級」。[11]使用超過128 GiB的ATA硬碟時需要48位元LBA。然而在Linux中,dd使用核心讀取或寫入原始裝置檔案[a]2003年釋出的2.4.23版本核心已經實現了對48位元LBA的支援。[12][13]

有人開玩笑說,dd意為「destroy disk」(破壞硬碟)或「delete data」(刪除資料),因為在對硬碟進行底層操作時,類似顛倒輸入和輸出檔案的一個小錯誤都可能造成部分或全部硬碟資料的遺失。[2]

dcfldd

編輯

dcfldddd的一個分支,由前美國國防部電腦取證實驗室雇員尼克·哈勃(Nick Harbour)開發的增強版本。[14][15][16]dd相比,dcfldd允許一個以上的輸出檔案,同時支援多種校驗計算方法,還提供了驗證模式以匹配檔案,並能顯示操作進度百分比。

參見

編輯

注釋

編輯
  1. ^ 這可以用strace檢查。

參考文獻

編輯
  1. ^ Bell Laboratories. dd man page. [2009-02-25]. (原始內容存檔於2011-02-08). 
  2. ^ 2.0 2.1 Sam Chessman. How and when to use the dd command?. CodeCoffee. [2008-02-19]. (原始內容存檔於2008-02-14). 
  3. ^ 3.0 3.1 Eric S. Raymond. dd. [2008-02-19]. (原始內容存檔於2018-12-13). 
  4. ^ 參見舊討論The Unix "dd" command. alt.folklore.computers. [2011-07-05]. (原始內容存檔於2011-07-09). 
  5. ^ linux - Why using conv=notrunc when cloning a disk with dd?. Stack Overflow. 2013-12-11 [2014-03-24]. (原始內容存檔於2014-03-24). 
  6. ^ Wright, Craig; Kleiman, Dave; Sundhar R.S., Shyaam. Overwriting Hard Drive Data: The Great Wiping Controversy. Lecture Notes in Computer Science. Information Systems Security. 2008, 5352: 243–257 [2012-03-07]. doi:10.1007/978-3-540-89862-7_21. (原始內容存檔於2019-09-24). 
  7. ^ Wipe: Secure File Deletion. Wipe.sf.net. [2014-03-24]. 
  8. ^ LAB Valentin. dd_rhelp author's repository. 2011-09-19 [2013-04-20]. (原始內容存檔於2008-05-16). Important note : For some times, dd_rhelp was the only tool (AFAIK) that did this type of job, but since a few years, it is not true anymore: Antonio Diaz did write a ideal replacement for my tool: GNU 'ddrescue'. 
  9. ^ Damaged Hard Disk. www.cgsecurity.org. [2008-05-20]. (原始內容存檔於2008-05-10). 
  10. ^ Interview with GNU ddrescue's Antonio Diaz Diaz. Blue-GNU. [2008-12-06]. (原始內容存檔於2008-04-15). 
  11. ^ Windows 137GB (128 GiB) Capacity Barrier - Seagate Technology (March 2003)
  12. ^ ChangeLog-2.4.23. www.kernel.org. [2009-12-07]. (原始內容存檔於2009-10-08). 
  13. ^ Linux-2.4.23 released Archive.is存檔,存檔日期2012-12-14 Linux kernel mailing list, 2003.
  14. ^ DCFLDD at Source Forge. Source Forge. [2013-08-17]. (原始內容存檔於2013-08-02). 
  15. ^ Jeremy Faircloth, Chris Hurley. Penetration Tester's Open Source Toolkit. Syngress. 2007: 470 – 472. ISBN 9780080556079. 
  16. ^ Jack Wiles, Anthony Reyes. The Best Damn Cybercrime and Digital Forensics Book Period. Syngress. 2011: 408 – 411. ISBN 9780080556086. 

外部連結

編輯