維基百科:使用時光機
本頁為操作指南,用於介紹中文維基百科社群的一些實作和操作方式。 本文只是論述,不屬於方針或指引。如果本指南與方針或指引起衝突或不一致,請以方針或指引的條文為準。 |
本頁提供關於使用網際網路檔案館的網站時光機(Wayback Machine)以通過維基百科條目參照網頁的存檔的資訊。若網頁出現變更、移動或者消失,原文連結會被保留。
編者亦被鼓勵去添加一個存檔連結作為引文的一部分,或者至少提供作為存檔的引文URL,同時引文可被參照或更新。
訪問https://archive.org/web/(可用HTTP連接訪問http://archive.org/web/),輸入感興趣的網頁的原始URL並點擊BROWSE HISTORY按鈕。接下來將會:
- 顯示一個日曆以列出該網頁所有存檔的副本的截取日期,
- 顯示當前頁的liveweb視圖並開始歸檔行程,
- 重新導向到最近存檔的副本,或
- 顯示錯誤資訊解釋該網頁為何無法存檔。
亦可直接手動存檔,訪問https://archive.org/web/,在頁面右下角的「Save Page Now」處輸入原始URL並點擊SAVE PAGE按鈕,接下來將會手動儲存當天的頁面。
URL格式
編輯「時光機」的連結通常以https://web.archive.org/web/開頭並跟隨一個星號或14位元的參照日期和時間,再用斜槓連接原網頁的URL。
起始請求
編輯以下例子展示鏈結到維基百科主頁所有存檔的日曆。
* https://web.archive.org/'web/ '*/https://www.wikipedia.org/
使用上述URL格式以顯示請求的頁面存檔的範圍。 點擊任意一個突顯的日期以選擇指定的存檔副本。
如果目標網頁未被存檔,頁面底部會出現一個輸入框,並帶有「Save this url in the Wayback Machine」的鏈結,點擊以後就會傳送請求到:
* https://web.archive.org/save/https:// www.wikipedia.org/
上述URL將會顯示請求頁面當前版本並開始試圖為此頁歸檔的進程。 若存檔成功,存檔副本將在完成後立刻提供。
對於某些請求頁面,「時光機」會返回錯誤信息解釋網頁為何無法存檔。 這些情況下需要嘗試其他諸如archive .is的存檔服務。
特定的存檔副本
編輯一旦目標網頁被存檔,任何一個特定的存檔日期會下列格式單獨請求。
下列連結範例為維基百科首頁在2002年9月30日12:35:25 pm(UTC)的存檔。日期和時間的格式為YYYYMMDDhhmmss。
使用上述格式會直接連結到指定的存檔副本。
在日期後面(或在其中)添加一個星號是顯示所有存檔的日曆的捷徑。
最近的存檔副本
編輯下列連結範例為存檔頁的最新版本。
使用上述格式會被重新導向到完整格式的URL,包含14位元的參照日期和時間戳,對於最近的存檔副本來說,取代了使用存檔直接連結特定的舊版本的目標。
同樣,一個與之相似但帶有數字1的URL連結最早的存檔副本。
參見:Advanced URL locator hints and tips——Internet Archive
限制
編輯若要求存檔的特定頁面活動了僅僅幾分鐘,該頁的存檔副本一般不能在幾日或幾周後提供。
網際網路檔案館尊重機器人排除標準並將不會為下列不被允許的頁面存檔。
例如,《紐約時報》有個位址為 http://www.nytimes.com/robots.txt 的 robots.txt 頁面會包含:
- User-agent: *
- Disallow: /aponline/
- Disallow: /archives/
- Disallow: /reuters/
因此,《紐約時報》網站中包含這些資料夾及其他任何相似的資料夾的URL的存檔請求就被排除在外。
《華盛頓郵報》的 http://www.washingtonpost.com/robots.txt 包含:
- User-agent: ia_archiver
- Disallow: /
這一指令直接阻止網際網路檔案館訪問全站。
Javascript小書籤
編輯在您的瀏覽器中,當你進入一個網頁的失效連結,並查詢 archive.org 的存檔,將下列代碼加為書籤,加上諸如Wayback的名稱(如 Wayback):
- javascript:void(window.open('https://web.archive.org/web/*/'+location.href));
然後,如果某個頁面失效,你可以點擊此書籤,並且會被自動帶入 Wayback Machine 的存檔記錄頁面。
如果上述書籤對您無效,還可以使用下列書籤:
- javascript:location.href='https://web.archive.org/web/*/'+document.location.href;
您還可以嘗試把一個網頁存為 archive.org 的存檔,將下列代碼加為書籤,加上諸如Wayback 存檔的名稱(如 Wayback 存檔):
- javascript:void(window.open('https://web.archive.org/save/'+location.href));
瀏覽器擴充
編輯如果您使用Mozilla Firefox,您可以添加Save To The Wayback Machine擴充,這將會增加右鍵進行查詢、儲存網頁的功能,並提供一個與上述內容相似的按鈕。
如果您使用Chrome或其他基於Chromium進行客製化的網頁瀏覽器,您可以添加網際網路檔案館(archive.org)開發的Wayback Machine擴充。
使用Webarchive模板
編輯{{webarchive}}可用於增加網頁存檔站點的連結。使用 |url=
、|title=
與 |date=
參數以定義URL、標題與日期。
基本範例:
{{webarchive |url=https://web.archive.org/web/20010727112808/http://www.wikipedia.org/ |date=2001-07-27 |title=Wikipedia }}
→ Wikipedia,存檔於網際網路檔案館(存檔日期 2001-07-27)
可以不包含日期:
{{webarchive |url=https://web.archive.org/web/*/http://www.wikipedia.org/ |date=* |title=Wikipedia }}
→ Wikipedia,存檔於網際網路檔案館(存檔 index)
請注意日期參數預設為 *
用於參照模板
編輯{{citation}}其他引文格式1模板支援|archiveurl=
參數(注意|archivedate=
參數也需要使用)。其他參照模板還會支援|archiveurl=
——參見這些模板的子頁面。
- {{citation
|url=http://www.wikipedia.org/
|title=Wikipedia Main Page
|archiveurl=//web.archive.org/web/20020930123525/http://www.wikipedia.org/
|archivedate=2002-09-30
|accessdate=2005-07-06
}}
→ Wikipedia Main Page. [2005-07-06]. (原始內容存檔於2002-09-30). - 在存檔資源記錄有原始發布日期時,使用
|date=
代替|accessdate=
。 - 當給任何一個在原始URL仍在使用的引文添加一個存檔URL的時候,可以添加
|deadurl=no
參數。
參見
編輯- {{dead link}},標記失效連結
- {{user archiveurl}},使用者方塊
- {{user Internet Archive}},使用者方塊
- {{user web archive}},使用者方塊
- {{Webarchive}},模板:Webarchive
- Wikipedia:失效連結,防止連結失效的方法
- Wikipedia:使用WebCite,使用非傳統的WebCite存檔服務的指引