討論:UTF-8
UTF-8屬於維基百科科技主題的基礎條目第五級。請勇於更新頁面以及改進條目。 本條目頁屬於下列維基專題範疇: |
|||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
本條目有內容譯自英語維基百科頁面「UTF-8」(原作者列於其歷史記錄頁)。 |
UTF8-octets = *( UTF8-char ) UTF8-char = UTF8-1 / UTF8-2 / UTF8-3 / UTF8-4 UTF8-1 = %x00-7F UTF8-2 = %xC2-DF UTF8-tail
UTF8-3 = %xE0 %xA0-BF UTF8-tail / %xE1-EC 2( UTF8-tail ) / %xED %x80-9F UTF8-tail / %xEE-EF 2( UTF8-tail ) UTF8-4 = %xF0 %x90-BF 2( UTF8-tail ) / %xF1-F3 3( UTF8-tail ) / %xF4 %x80-8F 2( UTF8-tail ) UTF8-tail = %x80-BF
已經不見 5,6 bytes 的編碼方式了,而且 0xC0,0xC1 以及 F5-FD 位保留
UTF-8 與 unicode 碼的轉換程式
編輯(我將之前 CRLin 貼上的整段 javascript 刪除了,如果要刊登自己的程式,其實大可以上傳到某個地方再貼上連結。) AbelCheung 07:55 2006年9月5日 (UTC)
只支援 4 位元組!?
編輯「為了和UTF-16的編碼空間一致,在最新的ISO 10646的標準裏,最多只使用4位元組編碼。5位元組及6位元組UTF-8已不會再使用。」 我完全無法理解這句說話,這是指如果要顯示 BMP 以外的字就不能用 UTF-8 嗎?別嚇我,這是甚麼鬼地方得出來的? AbelCheung 06:33 2006年8月6日 (UTC)
- UTF-8原來的確最長可有6位元組,完全容納UCS-4(
4位元組231,即2,147,483,648個碼位)的編碼範圍;但因UCS-2加上surrogate,亦即UTF-16,已可定義差不多一百萬個碼位,即BMP加上16個Supplementary Multilingual Plane,用4位元組的UTF-8已可覆蓋--水水(留言) 2017年11月30日 (四) 01:27 (UTC)--水水(留言) 2017年12月8日 (五) 01:41 (UTC)
需要重寫
編輯現在的內容情況是:
- 使用原因根本不是使用原因
- 批評是拿一個原因重複列出幾次
- 不少的錯誤內容,甚麼 4 字節、要和 UTF-16 兼容等等
- 比起英文版,中文版等於甚麼實質知識都沒有的空泛之談
- 現在的使用情況 (哪個 OS 用、哪處地方會用到等等) 完全沒有
似乎拿英文版來翻譯為妙。 AbelCheung 08:02 2006年9月5日 (UTC)
着手重寫
編輯我對這題目十分感興趣,將會依據英文版來重寫這題目(UTF-8)的內容。
—Yufung0903 07:22 2007年4月9日 (UTC)
霍夫曼編碼?
編輯有一段「雖然至少有兩類在技術上是受以前的 UTF-8規範所支援,但這些編碼上還沒有被賦予字元,所以不會在實際的文本中出現。 演算法設計與霍夫曼編碼類似。」,但在英文版中並沒有這樣的文句,二來,他是可變長度編碼,但未非霍夫曼編碼吧。 Zao (留言) 2008年7月19日 (六) 07:58 (UTC)
UTF-8對於非法編碼是如何處理的
編輯請問有沒有人知道這方面的材料,或者能在詞條里完善這方面的知識?
外部連結已修改
編輯各位維基人:
我剛剛修改了UTF-8中的2個外部連結,請大家仔細檢查我的編輯。如果您有疑問,或者需要讓機械人忽略某個連結甚至整個頁面,請訪問這個簡單的FAQ獲取更多信息。我進行了以下修改:
- 向 http://www.imc.org/mail-i18n.html 中加入存檔連結 https://web.archive.org/web/20071026103104/http://www.imc.org/mail-i18n.html
- 向 http://www.cs.bell-labs.com/sys/doc/utf.pdf 中加入存檔連結 https://web.archive.org/web/20050505032430/http://www.cs.bell-labs.com/sys/doc/utf.pdf
有關機械人修正錯誤的詳情請參閱FAQ。
外部連結已修改
編輯各位維基人:
我剛剛修改了UTF-8中的2個外部連結,請大家仔細檢查我的編輯。如果您有疑問,或者需要讓機械人忽略某個連結甚至整個頁面,請訪問這個簡單的FAQ獲取更多信息。我進行了以下修改:
- 向 http://www.linux.org/docs/ldp/howto/Unicode-HOWTO.html 中加入存檔連結 https://web.archive.org/web/20050404103611/http://www.linux.org/docs/ldp/howto/Unicode-HOWTO.html
- 向 http://netzreport.googlepages.com/online_tool_for_url_en_decoding.html 中加入存檔連結 https://web.archive.org/web/20070403222748/http://netzreport.googlepages.com/online_tool_for_url_en_decoding.html
有關機械人修正錯誤的詳情請參閱FAQ。