用戶:Xiplus/繁簡處理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文維基百科裏,繁簡處理和地區詞處理是字詞轉換系統的兩大組成部分。繁簡轉換旨在為用戶提供只針對單字的轉換(並包括繁簡/簡繁一對多的轉換,例如簡體的「打斗」會正確地轉換成繁體的「打鬥」),是進一步實現地區詞轉換的基礎。本頁面提出一些進行繁簡轉換編輯維護的指引。
維基百科簡體字與繁體字的轉換,是指中華人民共和國所制定規範漢字與華語圈傳統漢字之間的轉換,轉換範圍基本以《通用規範漢字表》為準,但亦會根據民間習慣和實際需要作彈性調整。
全域轉換
編輯維基百科的繁簡轉換總共通過三個轉換表來實現:其一是MediaWiki內建的轉換表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定義的簡體中文轉換表、其三是在MediaWiki:Conversiontable/zh-hant中定義的繁體中文轉換表。
如果您遇到了以下三種情況,請前往Wikipedia:字詞全域轉換修復請求中提報,管理員會儘快進行處理,而無需通過手工轉換來修復:
- 繁簡/簡繁一對多的轉換出現錯誤。例:「乾隆」被過度轉換成了「干隆」(由於「繁體:乾=>簡體:乾、干」的一對多轉換);
- 地區詞的全域轉換出現錯誤。例:「東加拿大」被過度轉換成了「汤加拿大」(由於「臺灣繁體:東加=>大陸簡體:汤加」的地區詞全域轉換),「撒贝宁」被過度轉換成了「撒貝南」(由於「大陸簡體:贝宁=>臺灣繁體:貝南」的地區詞全域轉換);
- 某一個單字沒有被轉換。例:「東」未被轉換成「东」,但此種情況較為罕見。
注意事項
編輯條目標題
編輯用繁體或簡體建立的頁面,標題必須全部為簡體或繁體字,如果標題繁簡混雜,例如「中國历史」,那麼系統將無法自動轉換。如果您發現了這樣的頁面,請將它移動到簡體標題或繁體標題,然後將重新導向頁面掛上{{d|R3}}標籤。但,某些會被系統視作簡體字的傳承字、俗字(如「杰」、「灯」等)的特殊情況除外(是否為簡體字應視具體情況而定)。
如果有繁簡體兩個版本的文章,則必須進行合併。具體參見Help:中文維基百科的繁簡、地區詞處理#編輯一般文章時的注意事項。通常這樣的情況很少見,維基程式會自動在你建立條目時判斷有無對應繁簡的條目並做出處理,但通過移動等方式也會產生同一事物的繁簡兩個版本條目。
若某頁面已存在繁體中文標題的頁面,亦不得建立簡體中文標題的相同內容的頁面,反之亦然,如已存在名為哈萨克的條目,亦不能建立名為哈薩克的條目。
勿與地區詞轉換相混淆
編輯雖然繁簡轉換與地區詞轉換都使用相同的轉換技術,但它們發揮的功能並不一樣。因此,請不要將地區詞的全域轉換請求提交到Wikipedia:繁簡體轉換請求中。如需了解更多相關的內容,請參見Wikipedia:地區詞處理。
勿替換條目繁簡陳述式
編輯編輯維基百科條目的時候,如果缺乏正當理由,請不要手動地將條目原始碼中的繁體陳述式轉為簡體,或簡體轉為繁體(廣義地也包括將一個地區用詞替換成另一地區用詞,如港澳繁體替換成臺灣繁體),以免影響他人的編輯和閱讀。手動做這種替換可能將被視為「繁簡破壞」,見Wikipedia:破壞#破壞類型中的「繁簡破壞」一條。
對於讀者來說,想只看繁體或簡體的讀者,可以在介面上方選擇「大陆简体」、「香港繁體」、「澳門繁體」、「大马简体」、「新加坡简体」與「臺灣正體」六者之一;
對於編輯者來說,想修正機器轉換不正確的詞彙,可以使用形如「-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-」這樣的「手工轉換」的技術,或者{{NoteTA}}模板。總之手動替換條目繁簡陳述式是沒有必要的。
請注意:若您的瀏覽器安裝了同文堂等中文繁簡轉換軟件,或可以進行中文繁簡轉換的流動應用程式,請在編輯時將其關閉或移除。
勿替換或手動轉換異體字
編輯儘管異體字間的功能相近,且所代表的意義相同,但手動替換異體字,很可能引發編輯爭議,甚至招致編輯戰的發生。因此在替換或手動轉換異體字之前,請先考慮以下兩種情況:
一是在現代漢語中或者電腦輸入中已經不再使用或者極少使用的異體字,如「靑/青」、「敎/教」、「囯/国」,這種情況下,將異體字替換為正體字是值得提倡的,反之則視為破壞。因為此類異體字在電腦輸入或者現代漢語中極少用到,使用此類異體字不便於閱讀。
二是目前現代漢語中仍然有在使用的異體字,此類異體字由於使用頻率較高,或者是在不同的地區,對哪一個字是正體的定義不一樣,例如「床/牀」,中國大陸和台灣把「床」視為正體字,把「牀」視為異體字,而在香港則是相反,香港視「牀」為正體,對此類異體字進行替換或手動轉換違反了避免地域中心方針。此外,「台/臺」這一對字由於政治原因常常成為修改的對象,由於「台」字雖為俗寫,但是在台灣已經廣泛使用,因此不應該對其進行替換,而是應該遵循先到先得的原則,因為對這些字進行替換對條目沒有實際的改善作用。
概括性來講:
- 如果所有地區皆常用A,罕用B→可將原始碼B直接改為A,不宜使用轉換。
- 如果某些地區常用A而罕用B,某些地區常用B而罕用A→原始碼文字先到先得,不得修改,同時全域轉換。
- 如果所有地區混用A/B→原始碼文字先到先得,不得修改,不得使用轉換。
- 如果某些地區混用A/B,其他地區常用A而罕用B→原始碼文字先到先得,不得修改,其他地區可使用轉換。
日本漢字
編輯因為日本漢字不屬於中文,所以日本漢字不應參與中文的繁簡轉換。但是,部分日本漢字與中文存在重疊,系統可能誤將其認作中文而轉換。
這種情況下,您應當使用{{lang|ja|日本語漢字}}
來防止其被誤轉換。如果是因為其他原因而非日本漢字需要避免被進行簡繁轉換的,如在一些網站,簡體和繁體的使用者名稱是被當做兩個不同的帳號,這時可以用-{汉字漢字}-
或<nowiki>汉字漢字</nowiki>
來達到禁止轉換的效果。在使用cite系列模板標記參考來源時,遇日文漢字可使用|script-title=ja:XXX
展示來源標題。(韓文漢字的情況同理,使用|script-title=ko:XXX
展示來源標題。)
外部連結
編輯- 《通用規範漢字表》(2013年08月19日發佈,中國大陸用字規範)