维基百科讨论:未被Unicode收录汉字之处理

条目命名中有“未收录汉字”

编辑

请问在条目名称中有“未收录汉字”或“僻字”的,有没有相关的格式指南,看到有以下几种:

  1. 用半角括号括起:克氏(鱼丹)闪电(鱼丹)(每欠)魮樊(⼟畿)不等式中山王(妾子)𧊒……
  2. 用全角括号括起:金长须(鱼丹)条纹裸(鱼丹)透体小(鱼丹)……
  3. 不括起:条纹裸鱼丹(与条纹裸(鱼丹)重复了)、目口 (隶定字)(括号内注明是文字,内容记述的是人物)、樊土畿……
  4. 用拼音代替:Biángbiáng面Hea中山王Cuo……
  5. 用其它字代替:斑马鱼(猜测鱼字应该用[鱼丹]字)……
  6. 用汉字结构表示:条纹裸⿰鱼丹 ……-Kudou-Michitoo

好象并没有统一的做法。-O-ring留言2012年8月28日 (二) 15:59 (UTC)回复

这些没收录是不是unicode私用字区的?不是应该被禁止建立吗?——路过围观人士 2012年8月29日 (三) 01:00 (UTC)回复
应该向unicode提交新增这些字的请求,这样这些字才能在未来有可能显示--百無一用是書生 () 2012年8月29日 (三) 01:56 (UTC)回复
为什么樊(⼟畿)不等式用的是“⼟”而不是“土”?--氢氧化钠 NaOH 2012年8月29日 (三) 02:43 (UTC)回复
“⼟”是康熙部首,“土”是常用字。-O-ring留言2012年8月29日 (三) 09:52 (UTC)回复

原来这个问题以前也有人提过,见这里这里这里。不过没有解答命名原则的问题,是不是把它统一起来比较好,以避免半角和全角括号并存、常用字(土)和僻字部首(⼟)并存、重复创建的问题出现。-O-ring留言2012年8月29日 (三) 09:52 (UTC)回复

“⼟”就不是个字,这个编码是给作部首的“土”字的。Liangent留言 2012年8月29日 (三) 10:45 (UTC)回复
那么“⼟”应该不是读做“土”,而是“土部”吧。不知道有哪些输入法可以打出“⼟”的?--O-ring留言2012年8月29日 (三) 11:14 (UTC)回复
长远来看,根子上还是需要和unicode合作才能解决问题--百無一用是書生 () 2012年8月29日 (三) 11:48 (UTC)回复

岔个话题:僻字的显示问题

编辑

即便是收录了的汉字,一些条目里面有僻字的时候,我的浏览器可能会显示不出,有时候是在“编辑”状态下可以显示,在预览或提交状态下就显示不出了。但是复制到Word里面似乎都可以显示。遇到这种情况,我需要怎么调整一下?需要下载或者安装什么东西吗?--氢氧化钠 NaOH 2012年8月29日 (三) 02:32 (UTC)回复

试试安装Wikipedia:UNICODE里面的Unifonts 6.0,还有调整浏览器所用字体。通常以上两项都做好了就行了,但如果还不行那可能需要调整操作系统或浏览器的字体链接机制,挺麻烦的。--YFdyh000 2012年8月29日 (三) 03:01 (UTC)回复
还是希望有webfont的支持--百無一用是書生 () 2012年8月29日 (三) 03:29 (UTC)回复
也有用“□”和“口”代替僻字的做法,见儒家主要派别列表。--O-ring留言2012年8月29日 (三) 10:16 (UTC)回复
fonts-hanazono是自由字体。debian下sudo aptitude install fonts-hanazono即可。--水树美月留言2012年9月7日 (五) 13:28 (UTC)回复
天,扩展b,c,d区就有47,082个汉字[1]--百無一用是書生 () 2012年9月7日 (五) 14:04 (UTC)回复
刚发现这里有中文webfont的解决方案[2]--百無一用是書生 () 2012年9月7日 (五) 14:49 (UTC)回复

关于未进入统一码的汉字[以下简称未入U字]的条目处理问题

编辑

什么引文我也不说了,知道的人自然知道,不知道的人看戏就好了。

现在,在条目中的未入U字自然可以用图片处理,然而作为条目名却有很大问题 现有处理方式有:

另,部分页面内未入U字未用图片字显示,而用部件罗列:黎裕宗建议改为图片字

再另,部分页面已佚字用问号代替我觉得不好:岷王_(明朝第十二任)(~)补充文中已佚字建议用□字符,理据来源是本文<补充于-七个点留言 Flow留言2017年5月2日 (二) 14:53 (UTC)>回复

先撷取出特例Biángbiáng面来谈一下,这个字我认为只能使用这种拼音形式,原因:该字无定势,无标准写法,而且就算是部件相同的写法,如何罗列也有区别,而且写法众多。请看本文最末段此条目不参与下文的说明。
再撷取出特例duang来谈一下,个人认为,成龙合文是原创研究,使用者并不多,这个Meme主要还是以拼音形式传播,而非这个合文。此条目不参与下文的说明。
  • 对于以上这几种方法我觉得还是需要更改为IDS来描述更为合适
    • 括号包住字的构件的方法虽然界定清晰,但是无法描述部件是以何种方式排列参与构字。
    • 字的构件直接罗列,就连上文的优点都没有。
    • 汉语拼音入文一不合适,且很多人认字形不看字音,不容易查找,况且同音字那么多,谁知道你说的哪一个。
    • 直接略过完全损失信息更不适合,部件代替(声旁)亦有问题,声旁与这个字发音不同误导群众。

所以我还是建议使用IDS来,这样即精确又符合国际通行的方法,但是我认为其他网络上存在的代替方法可以作为重定向来,归类入别名重定向

感谢观看--七个点留言 Flow留言2017年5月2日 (二) 06:11 (UTC)回复

小修正--七个点留言 Flow留言2017年5月2日 (二) 06:16 (UTC)回复

(~)补充这是关于IDS使用的实例,可做参考--七个点留言 Flow留言2017年5月2日 (二) 06:22 (UTC)回复

<(~)补充这是所有(除biang和duang外)上述条目名改后可能的条目名称(亻革)家人-⿰亻革家人 (每欠)魮-⿰每欠魮 (气云)-⿹云气 (犭亚)兽目-⿰犭亚兽目 㹧(犭茶)湖避塘-㹧⿰犭茶湖避塘 世界第一麦方-世界第一⿺麦方 中山王Cuo-中山王⿳⿴𦥑同冖昔 凤赤相鱼-凤⿱赤相鱼口湖牵水藏-口湖牵水⿰车藏 后宅下天后宫-后宅下⿱丷土天后宫 樊(⼟畿)不等式-樊⿰土畿不等式 樊畿-樊⿰土畿 目口 (隶定字)-⿱目口 黎维(礻密)-黎维⿰礻密---七个点 (留言 Flow留言 个人的黑名单2017年5月6日 (六) 11:03 (UTC)>回复

两点:biang字已经提交到unicode了[3];未收录汉字目前可用MediaWiki:Gadget-webfont.js临时解决,但只能用于内文,条目名称没有办法--百無一用是書生 () 2017年5月2日 (二) 11:05 (UTC)回复
@Shizhao:该提案被日本人质疑,我很怀疑他通过的可能性,要看魏安坚不坚持咯,况且我记得biang是从扩F推到扩G,以后还会不会再推到扩H两说呢。而且biang又不紧迫,紧迫的是后宅下天后宫里面的字才对,这个字IDS都好麻烦。;内文有好的处理方法,而题目确是如此的不一致,好歹统一成一个方法啊。--七个点留言 Flow留言2017年5月2日 (二) 11:25 (UTC)回复
气云这个字好像已经提交到ISO那边了--百無一用是書生 () 2017年5月3日 (三) 13:08 (UTC)回复
光有提案有毛用...需要用例,而且是纸质资料,还必须是有ISBN号的书(针对新造字),要么就是像四元素字找国家背书,我看这个字玄得要死-七个点 (留言 Flow留言 个人的黑名单2017年5月3日 (三) 14:41 (UTC)回复
不过这个字形似乎可以通过氲的异体这一途径进入统一码,所以我上文的补充没错-七个点 (留言 Flow留言 个人的黑名单2017年5月3日 (三) 14:48 (UTC)回复
就是有国家背书的啊(全国名词委有相关决议),而且有书收录[4]--百無一用是書生 () 2017年5月4日 (四) 02:44 (UTC)回复
这算什么背书...不过biang字这会有点意思,可能拖不下去了,看这里。--七个点 (留言 Flow留言 个人的黑名单2017年5月4日 (四) 07:15 (UTC)回复
名词委的决议就是像化学元素一样让国家背书啊--百無一用是書生 () 2017年5月8日 (一) 02:31 (UTC)回复
化学那四个字...先说点其他的吧,上面那些字有些还是在有生之年必然不会被编码,这些字到底该怎么处理--七个点 (留言 Flow留言 个人的黑名单2017年5月8日 (一) 09:05 (UTC)回复
返回到项目页面“未被Unicode收录汉字之处理”。