一分钟学会ASCII、Unicode、utfITeye - 凯时娱乐

一分钟学会ASCII、Unicode、utfITeye

2019年03月14日13时52分52秒 | 作者: 凡梅 | 标签: 编码,字节,英文 | 浏览: 716

 

一下是一篇完全相同的英文文本运用ASCII、Unicode、utf-8编码方法保存后的文本巨细

 

ASCII编码是1个字节,但这种编码方法最多只能包容255个字符,因而其它言语如中文无法用ASCII编码表明。

Unicode编码一般是2个字节,共可包容65536个字符在经过相应的署理机制完成附加的917476个字符仅有表明,因而可仅有的标识世界上简直每一种言语的字符。

但假如一篇文档中有许多英文的话,运用Unicode编码所占用的内存就会比运用ASCII编码占用的内存高出一倍(由于在Unicode编码下一个英文字符也是占用2个字节),如此便会糟蹋很多的存储空间。为处理这个问题,utf-8编码由此诞生。

utf8编码为可变长编码,编码时把一个字符按需编码成1-6个字节,如英文编成1个字节,汉字一般编成3个字节,由此到达既能存储一切类型的字符,一起又最小化存储巨细,减小存储和传输本钱。

 

以下为一篇半英文半中文的文档别离运用Unicode编码和utf-8编码时的文件巨细



 

版权声明
本文来源于网络,版权归原作者所有,其内容与观点不代表凯时娱乐立场。转载文章仅为传播更有价值的信息,如采编人员采编有误或者版权原因,请与我们联系,我们核实后立即修改或删除。

猜您喜欢的文章