七叶笔记 » java编程 » java 汉字几个字节

java 汉字几个字节

java 汉字几个字节

java中,只要是字符,不管是数字还是英文还是汉字,都占2个字节,都是一个char。

char c1 = '中'; char c2 = 'A'; char c3 = '1';

确切说,Unicode编码是指一类编码的统称,而非某个具体编码。utf-8跟unicode是不一样的。

以utf8为例,utf8是一个变长编码标准,可以以1~4个字节表示一个字符,而中文占3个字节,ascII字符占1个字节。

因为java是以unicode作为编码方式的。unicode是一个定长的编码标准,每个字符都是2个字节,也就是1个char类型的空间。

扩展知识:

Unicode是一个编码方案,Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode 编码共有三种具体实现,分别为utf-8,utf-16,utf-32,其中utf-8占用一到四个字节,utf-16占用二或四个字节,utf-32占用四个字节。目前Unicode 码在全球范围的信息交换领域均有广泛的应用。

php中文网,大量的免费Java入门教程,欢迎在线学习!

相关文章