通常,数据以位(1或0)的形式存储在计算机中。有多种可用的编码方案来指定每个字符代表的字节集。
ASCII -代表一个MERICAN小号标准协商Ç颂为我载文信息我nterchange。它由美国标准协会开发,是最常用的编码系统。它使用7位来表示字符,包括128个字符:大写和小写拉丁字母,数字0-9和一些额外的字符)。
Unicode(UTF) -代表Unicode转换格式。它是由Unicode联盟开发的。如果要创建使用来自多个字符集的字符的文档,则可以使用单个Unicode字符编码来创建。它提供3种类型的编码。
UTF-8-它以8位为单位(字节),UTF8中的字符长度可以从1到4个字节,从而使UTF8的宽度可变。
UTF-16-以16位为单位(短裤),长度可以是1或2个短裤,从而使UTF16的宽度可变。
UTF-32-以32位单位(长)出现。它是一种固定宽度的格式,长度始终为1“长”。
下表列出了Java中用于表示各种编码标准的位数。
表示 | 使用的位 |
---|---|
ASCII | 7位(表示为8位)。 |
UTF-8 | 8、16和18位模式。 |
UTF-16 | 16位和更大的位模式。 |