1、中文汉字的编码范围:[\u4e00-\u9fa5](java相关视频教程推荐:java视频教程)
下面的方法判断一个字符是不是汉字
//如果是一个汉字返回true,否则返回falsepublic static boolean checkCharCN(char c){ String s = String.valueOf(c); String regex = "[\u4e00-\u9fa5]"; Pattern p = Pattern.compile(regex); Matcher m = p.matcher(s); return m.matches(); }
Java用的是Unicode 编码char 型变量的范围是0-65535 无符号的值,可以表示 65536个字符,基本上地球上的字符可被全部包括了
汉字基本集中在[19968,40869]之间,共有20901个汉字
unicode编码范围:
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])