討論:Unicode補完計畫
由YChao在話題關於 UAO 說明的錯誤之處上作出的最新留言:13 年前
關於 UAO 說明的錯誤之處
編輯來自 218.169.10.45 12:08 2007年1月11日 (UTC) 取得原作者同意後所擷取的討論區對話。因為合意使用不具名方式,所以有關原作者的部分使用 *** 來代替。
※ 引述《*** (***)》之銘言: > ※ 引述《*** (***)》之銘言: > > ※ 引述《*** (***)》之銘言: > > > 「Unicode補完計畫」的原理是把大五碼造字區的區位, > > > 和 Unicode 的相關字元作雙向對應, > > > 以達到無須藉著外字集,也能使大五碼文件或檔名使用原先欠缺的漢字。 > > > 第一句話就錯了............ > > 正確的是?(搓手準備用訪客身分改) > 他是把造字區跟unicode區單向對應 > 造字 --> unicode > unicode -/-> 造字 > (這邊沒問題) > 然後把big5區跟unicode中的日文漢字區雙向對應 > 中文 <--> 日文漢字 > (這邊被幹到爆炸,因為這樣變向造出一堆奇怪的日文檔XD)
- 造字區有雙向對應。你可以作個實驗,在文章裡面輸入日文假名(屬於造字區),然後用Big5存檔,拿到只裝有中國海字集的電腦(一樣屬於造字區),可以看得到日文。Unicode補完技術原作者之一是User:But,你可以問他。--Jnlin(討論) 12:12 2007年1月11日 (UTC)
- 感謝 Jnlin 的說明,我會問問看 UAO 作者,還有回報給上文的原作者的。 --220.129.5.147 03:57 2007年1月12日 (UTC)
- 雖然這個已經是2007年的條目,但有些說明上的問題,想在這裡提一下:
- 自從windows作業系統轉換至unicode之後,內部的儲存和顯示都是透過轉碼表的方式,來相容舊時代的軟體(ANSI)與文件。對中文使用者來說,就是CP950的編碼。
- 而Big5一直以來都存在字數過少的問題,因此有著各種擴充版本的出現。當然最有名的、也是UAO對應的重點:中國海字集。
- 中國海字集算是一個de facto的使用者造字版本,某種程度也包還了先前的擴充字集如倚天碼中的日文假名。但到了unicode的時代,windows內建的編碼表並沒有特別處理,就直接把big5中使用者造字區,對應到unicode的私有保留區。但實際上,中國海字集收錄的造字,已經大多數都收在unicode中,所以UAO這裡只是把這些原本是Big5外字的部份,重新對應map到unicode已經存在(收錄)的字碼上。
- 因為wndows系統字碼對應是雙向的,所以原先unicode中不存在於Big5的字碼,也可以因此對應到擴充版本的外字上。某種程度解決BBS上外字(日文)使用的問題。但也因為是雙向的對應,直接將unicode文件以big5儲存的話,對沒有對應映射(UAO)的使用者來說,拿到的只是一堆無法顯示外字集的資料。
- 由於windows系統對於FAT檔案系統,為了相容性仍採ANSI編碼,中文使用者則是CP950編碼。如果與沒有安裝UAO的使用者交換檔案(轉換到Big5造字區)時,也會出現檔名無法顯示(對應回unicode私有保留區)的問題。
- 這些問題的解決方案,自然是把原先有使用外字集的文件,全部經過UAO的對應,存成unicode的編碼格式。
- 香港特區造字,因為也收錄了部份外字集如倚天碼,所以Big5日文假名可以顯示,但是與中國海字集不相容。同時因為實務上Big5造字字碼空間有限,也不太可能兩者並存。
- 當然對非Big5編碼的軟體顯示與輸入而言,自然不是UAO所可以解決的。YChao (留言) 2011年6月13日 (一) 16:30 (UTC)
FireFox
編輯對於不是使用系統字碼表的軟件──例如 Mozilla Firefox 等跨平臺瀏覽器或 Java 軟件──補完計劃會無效,這些軟件需要「個別補完」(例如有些社群版的 Firefox,就有將補完後的字碼表編譯進去)。—以上留言未簽名。
- FireFox自2.0起已內建單向「補完」。-- 210.17.246.210 2007年11月13日 (二) 09:42 (UTC)