用户:中日韩越的汉字/关于排序
排序法则:
1.先按照汉字的音序顺序(大陆普通话)来排序,拉丁字母或者数字开头的放在末尾(先数字后字母),若有非拉丁字母的文字则按照罗马化来排序;
2.按照第一个字的拼音的拉丁字母来排序(u和ü一般混同,只有混同时不能区分才ü排在u后);
3.音节相同的就按字的声调“阴平→阳平→上声→去声→轻声”的次序来排(另见关于轻声字);
4.第一个字读音相同,就按第二个字的读音来确定(不管第一个字是什么,同音字混排。若第二个字是数字、拉丁字母或其他字的就在汉字后面排序),以此类推;
5.只有读音完全相同才可按每个字的笔画数顺序排序(简体),按照《GB13000.1字符集汉字字序(笔画序)规范》。
备注:
1.这里要强调的是,读音完全相同才逐字按笔画数排序,如第一个字都读shí的,就按照下一个字的读音“时间”、“食品”、“时速”、“石头记”的顺序排好,而非“石头记”、“时间”、“时速”、“食品”的笔画次序,详细请见下文的“关于同音字”。
2.另外,对于字的读音有异读或者不易确定的,一律按照《普通话异读词审音表》规定读音来确定(如“粳米按照jīnɡ mǐ而非ɡēnɡ mǐ来确定”,“密钥按照mì yuè而非mì yɑ̀o来确定”),对于部分生僻字词以及易念错的字则会进行相应地注音;
3.下方的列表当中,翘舌音(R除外)以及音节字母为Yu开头的用粗体字表示(目的是方便排序以及查找,且可纠正方音),而对于声母J Q X而言,尖音斜体表示,团音正体表示(目的是这三个声母的字比较多,要通过方言音——《广韵》为基础——来分开,如“剑”和“箭”)。
关于同音字
编辑传统词典的汉语拼音排序是一个字一个字的进行比较,只有第一个字相同时第二个字才可有排序的资格,然后是第三个字、第四个字……以此类推。
这在笔画排序上是没有太大问题的,因为字形都是固定的,不会发生变化,但在拼音排序上就容易产生问题,因为汉语的同音字有很多,而又说是拼音顺序,则不能因一个字读音确定了而直接进行字形上的排序(当然是间接,指的是每个字读音都一样时才可给字形排序)。
既然是“汉语拼音次序”,那么应当以拼音为排序的载体,像下面一些词组的排序:
平安(pínɡ ɑ̄n)
苹果(pínɡ ɡuǒ)
平面(pínɡ miɑ̀n)
屏幕(pínɡ mù)
萍水(pínɡ shuǐ)
瓶子(pínɡ zi)
前面都读pínɡ,显然要从第二个字开始排序。如果把这几个词按拼音顺序念出来的话是比较通顺的,再比较:
平安
平面
苹果
屏幕
瓶子
萍水
同样也是拼音排序,但这个排序法常出现在词典上,明显是第一个字相同才能比较第二个字(同音字常按笔画排序),念出来的话是感觉没有顺序的。
这一点日语、韩语的词典做得好,它们备注的汉字只是起到备注作用,主要还是按照五十音或者谚文排序,然后就是假名或谚文相同的按汉字字形排序。
汉语的词典产生这样排序的原因是古代主要是字典,需要注解的字用大字形表示,这样的习惯也沿袭到我们现在的词典当中,显然不可能出现正规的拼音排序(因为是一个字一个字来的)。
因此,为了改掉这个影响排序的规则,我干脆直接按拼音排序,对音不对字,除非读音完全相同。
百度百科条目韵部排序规则
编辑为便于研究音韵学的韵部及古入声字的分布情况,我将百度百科条目按照最后一个字的韵母分类,详情见User:中日韩越的汉字/百度百科条目索引。