用户:Xiplus/繁简处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科里,繁简处理和地区词处理是字词转换系统的两大组成部分。繁简转换旨在为用户提供只针对单字的转换(并包括繁简/简繁一对多的转换,例如简体的“打斗”会正确地转换成繁体的“打鬥”),是进一步实现地区词转换的基础。本页面提出一些进行繁简转换编辑维护的指引。
维基百科简体字与繁体字的转换,是指中华人民共和国所制定规范汉字与华语圈传统汉字之间的转换,转换范围基本以《通用规范汉字表》为准,但亦会根据民间习惯和实际需要作弹性调整。
全局转换
编辑维基百科的繁简转换总共通过三个转换表来实现:其一是MediaWiki内置的转换表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定义的简体中文转换表、其三是在MediaWiki:Conversiontable/zh-hant中定义的繁体中文转换表。
如果您遇到了以下三种情况,请前往Wikipedia:字词全局转换修复请求中提报,管理员会尽快进行处理,而无需通过手工转换来修复:
- 繁简/简繁一对多的转换出现错误。例:“乾隆”被过度转换成了“干隆”(由于“繁体:乾=>简体:乾、干”的一对多转换);
- 地区词的全局转换出现错误。例:“東加拿大”被过度转换成了“汤加拿大”(由于“台湾正体:東加=>大陆简体:汤加”的地区词全局转换),“撒贝宁”被过度转换成了“撒貝南”(由于“大陆简体:贝宁=>台湾正体:貝南”的地区词全局转换);
- 某一个单字没有被转换。例:“東”未被转换成“东”,但此种情况较为罕见。
注意事项
编辑条目标题
编辑用繁体或简体建立的页面,标题必须全部为简体或繁体字,如果标题繁简混杂,例如“中國历史”,那么系统将无法自动转换。如果您发现了这样的页面,请将它移动到简体标题或繁体标题,然后将重定向页面挂上{{d|R3}}标签。但,某些会被系统视作简体字的传承字、俗字(如“杰”、“灯”等)的特殊情况除外(是否为简体字应视具体情况而定)。
如果有繁简体两个版本的文章,则必须进行合并。具体参见Help:中文维基百科的繁简、地区词处理#编辑一般文章时的注意事项。通常这样的情况很少见,维基程式会自动在你建立条目时判断有无对应繁简的条目并做出处理,但通过移动等方式也会产生同一事物的繁简两个版本条目。
若某页面已存在繁体中文标题的页面,亦不得创建简体中文标题的相同内容的页面,反之亦然,如已存在名为哈萨克的条目,亦不能创建名为哈薩克的条目。
勿与地区词转换相混淆
编辑虽然繁简转换与地区词转换都使用相同的转换技术,但它们发挥的功能并不一样。因此,请不要将地区词的全局转换请求提交到Wikipedia:繁简体转换请求中。如需了解更多相关的内容,请参见Wikipedia:地区词处理。
勿替换条目繁简语句
编辑编辑维基百科条目的时候,如果缺乏正当理由,请不要手动地将条目源码中的繁体语句转为简体,或简体转为繁体(广义地也包括将一个地区用词替换成另一地区用词,如港澳繁体替换成台湾正体),以免影响他人的编辑和阅读。手动做这种替换可能将被视为“繁简破坏”,见Wikipedia:破坏#破坏类型中的“繁简破坏”一条。
对于读者来说,想只看繁体或简体的读者,可以在界面上方选择“大陆简体”、“香港繁體”、“澳門繁體”、“大马简体”、“新加坡简体”与“臺灣正體”六者之一;
对于编辑者来说,想修正机器转换不正确的词汇,可以使用形如“-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-”这样的“手工转换”的技术,或者{{NoteTA}}模板。总之手动替换条目繁简语句是没有必要的。
请注意:若您的浏览器安装了同文堂等中文繁简转换软件,或可以进行中文繁简转换的移动应用程式,请在编辑时将其关闭或移除。
勿替换或手动转换异体字
编辑尽管异体字间的功能相近,且所代表的意义相同,但手动替换异体字,很可能引发编辑争议,甚至招致编辑战的发生。因此在替换或手动转换异体字之前,请先考虑以下两种情况:
一是在现代汉语中或者电脑输入中已经不再使用或者极少使用的异体字,如“靑/青”、“敎/教”、“囯/国”,这种情况下,将异体字替换为正体字是值得提倡的,反之则视为破坏。因为此类异体字在电脑输入或者现代汉语中极少用到,使用此类异体字不便于阅读。
二是目前现代汉语中仍然有在使用的异体字,此类异体字由于使用频率较高,或者是在不同的地区,对哪一个字是正体的定义不一样,例如“床/牀”,中国大陆和台湾把“床”视为正体字,把“牀”视为异体字,而在香港则是相反,香港视“牀”为正体,对此类异体字进行替换或手动转换违反了避免地域中心方针。此外,“台/臺”这一对字由于政治原因常常成为修改的对象,由于“台”字虽为俗写,但是在台湾已经广泛使用,因此不应该对其进行替换,而是应该遵循先到先得的原则,因为对这些字进行替换对条目没有实际的改善作用。
概括性来讲:
- 如果所有地区皆常用A,罕用B→可将源码B直接改为A,不宜使用转换。
- 如果某些地区常用A而罕用B,某些地区常用B而罕用A→源码文字先到先得,不得修改,同时全局转换。
- 如果所有地区混用A/B→源码文字先到先得,不得修改,不得使用转换。
- 如果某些地区混用A/B,其他地区常用A而罕用B→源码文字先到先得,不得修改,其他地区可使用转换。
日本汉字
编辑因为日本汉字不属于中文,所以日本汉字不应参与中文的繁简转换。但是,部分日本汉字与中文存在重叠,系统可能误将其认作中文而转换。
这种情况下,您应当使用{{lang|ja|日本語漢字}}
来防止其被误转换。如果是因为其他原因而非日本汉字需要避免被进行简繁转换的,如在一些网站,简体和繁体的用户名是被当做两个不同的账号,这时可以用-{汉字漢字}-
或<nowiki>汉字漢字</nowiki>
来达到禁止转换的效果。在使用cite系列模板标记参考来源时,遇日文汉字可使用|script-title=ja:XXX
展示来源标题。(韩文汉字的情况同理,使用|script-title=ko:XXX
展示来源标题。)
外部链接
编辑- 《通用规范汉字表》(2013年08月19日发布,中国大陆用字规范)