維基百科:機械人建立條目小組/中華人民共和國行政區劃/整體說明

由於武鐵輛玻找到了國家統計局的含編碼數據庫[失效連結],我們得以系統地利用機械人進行區劃維護工作。

編碼方式

編輯

不做詳細說明。編碼的利用請見下一節。對於基本編碼模式,結合具體例子說明如下:

第一位 第二位 第三位 第四位 第五位 生成編碼
河北省 13 00 00 000 000 13/00/00/000/000
大慶市 23 06 00 000 000 23/06/00/000/000
沙縣 35 04 27 000 000 35/04/27/000/000
大寨鎮 14 07 24 104 000 14/07/24/104/000
華西新市村 32 02 81 107 200 32/02/81/107/200
省級代碼 地級代碼 縣級代碼 鄉級代碼 村級代碼 生成編碼

對於例外,僅舉幾例說明:

第一位 第二位 第三位 第四位 第五位 生成編碼 情況說明
浦東新區 31 01 15 000 000 31/01/15/000/000 直轄市轄區縣,第二位01為市轄區、02為縣。
東城街道 (東莞市) 44 19 00 003 000 44/19/00/003/000 地級直管鄉級,無縣級。
石河子市 65 90 01 000 000 65/90/01/000/000 省級直管縣級,地級一欄添了一個90。
省級代碼 地級代碼 縣級代碼 鄉級代碼 村級代碼 生成編碼

形成機制

編輯

數據形成機制:以甘井子區(代碼:21/02/11/000/000)為例。

(條目形成機制尚未完善)

消歧義

編輯

消歧義主要由系統生成。但是由於已撤銷的行政區很多(當然還有和大陸以外行政區重名的情況),所以還有大量的手工消歧義。

形成消歧義的手段是:

效果如下:

  • 甘井子區,中華人民共和國遼寧省大連市下轄的市轄區
  • 楊浦區,中華人民共和國上海市下轄的市轄區

這樣可以確保上級行政區名稱更改之後,消歧義頁面無需改動。但是下級行政區的消歧義名稱可能仍然要修正。另外此方法不支持PopUp,可能不支持AutoWikiBrowser

變動和維護

編輯

這個數據庫每年都會更新,所以我們可以每年讀一次數據庫,找出變化並進行更新,這樣可以確保時效性。我們仍然歡迎手動維護。

由於撤銷的行政區的代碼不會被再次使用,被撤銷的行政區的維護非常方便,無需刪除原有數據頁面。

可能會參照過去的數據進行測試性運行,查找被撤銷的行政區劃條目。

其他

編輯