自由博客unicode轉(zhuǎn)換器,可以將unicode轉(zhuǎn)換為gb2312漢字,或者將gb2312漢字轉(zhuǎn)換為unicode,你也可以用“漢字轉(zhuǎn)Unicode”,不需要更改編碼順序了。
Unicode編碼簡(jiǎn)介
Unicode是一種計(jì)算機(jī)字符編碼。也稱“統(tǒng)一碼”“萬國碼”。
Unicode只有一個(gè)字符集,中、日、韓的三種文字占用了Unicode中0×3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用兩個(gè)字節(jié)來編碼一個(gè)字符, 比如漢字”經(jīng)”的編碼是0x7ECF,注意字符編碼一般用十六進(jìn)制來 表示,為了與十進(jìn)制區(qū)分,十六進(jìn)制以0x開頭,0x7ECF轉(zhuǎn)換成十進(jìn)制 就是32463,UCS-2用兩個(gè)字節(jié)來編碼字符,兩個(gè)字節(jié)就是16位二進(jìn)制, 2的16次方等于65536,所以UCS-2最多能編碼65536個(gè)字符。 編碼從0到127的字符與ASCII編碼的字符一樣,比如字母”a”的Unicode 編碼是0×0061,十進(jìn)制是97,而”a”的ASCII編碼是0×61,十進(jìn)制也是97,對(duì)于漢字的編碼,事實(shí)上Unicode對(duì)漢字支持不怎么好,這也是沒辦法的, 簡(jiǎn)體和繁體總共有六七萬個(gè)漢字,而UCS-2最多能表示65536個(gè),才六萬 多個(gè),所以Unicode只能排除一些幾乎不用的漢字,好在常用的簡(jiǎn)體漢字也不過七千多個(gè),為了能表示所有漢字,Unicode也有UCS-4規(guī)范,就是用 4個(gè)字節(jié)來編碼字符.
GB2312編碼簡(jiǎn)介
GB2312 也就是信息交換用漢字編碼字符集。GB2312編碼適用于漢字處理、漢字通信等系統(tǒng)之間的信息交換,中國大陸幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB 2312。
信息交換用漢字編碼字符集和漢字輸入編碼之間的關(guān)系是,根據(jù)不同的漢字輸入方法,通過必要的設(shè)備向計(jì)算機(jī)輸入漢字的編碼,計(jì)算機(jī)接收之后,先轉(zhuǎn)換成信息交換用漢字編碼字符,這時(shí)計(jì)算機(jī)就可以識(shí)別并進(jìn)行處理;漢字輸出是先把機(jī)內(nèi)碼轉(zhuǎn)成漢字編碼,再發(fā)送到輸出設(shè)備。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版