Java字元

Java字元【Java字元】计算机记忆体和硬碟等存储空间的管理都是以位元组为基本单位,每个位元组都有自己的编号,而“字元-Char”是人们用作标记的符号,如'A'、'一'等,每个字元都具有约定的抽象含义 。
基本介绍中文名:Java字元
外文名:char
基本单位:位元组
含义:字元-Char
编号:A'、'一'
java基本数据类型占用空间(B)取值範围(起点)取值範围(结束点)byte(整型)1-2^7 (-128)2^7-1(127)short(整型)2......int(整型)4......long(整型)8......char(字元)1~4任意单个字元任意单个字元boolean(布尔型)1true/falsetrue/falsefloat(单精度)4-3.403e38(有效位数6~7位)3.403e38(有效位数6~7位)double(双精度)8-1.798e308(有效位数15位)1.793e308(有效位数15位)数据类型位元组byte它是计算机的数据存储单元,每个位元组包括8个二进制“位-bit”,可以保存8位的二进制数 。由于受到电子设备的物理特定限制,例如磁性存储器只适合保存两种状态的信息—磁性的强弱、以电信号的方式也只适合传递两种状态的信息—电压的高低,因此在计算机中最终结果时再将转换为人们熟悉的格式,如十进制数值、字元和图形等 。字元集Charset为了实现对字元信息的存储,人们将可能用到的字元排成一个有序的字元伫列,这种由多个有序字元组成的集合称为“字元集-Charset”,而在计算机中世纪保存的是字元在字元集中的序号,即一个二进制形式的整数 。而到底採用1个还是多个位元组以及具体如何来存储一个字元集的字元,这种相关的规定被称为“编码-Encoding” 。Java最初採用的是16位Unicode编码(UTF-16)来表示字元,无论序号大小,每个Java字元都占用定长的2B(16个二进制位),因此最多能表示65536个不同的字元,这只是粗略的说法,实际上如果採用变通的方式进行字元编码,UTF-16编码可以表示的字元远多于65536个 。例如,从JDK5开始Java语言引入了Unicode编码规範中的代码点(Code Point)机制,将每个字元对应的代码称为一个代码点,基本的多语言字元的代码点还是用16位表示,这16位的二进制数据也称为一个单元代码(Code Unit),此时一个代码单元也对应一个代码点;而后扩充辅助字元则编码为2个连续的代码单元(32位),此时一个代码点有两个代码单元组成,这实际上是将UTF-16也变成了可变长度编码 。字元常量(1) 用英文单引号括起来的单个字元,例如:'a'、'字' 。这是最常见的声明字元形式 。(2) 用英文单引号括起来的十六进制字元代码值来表示单个字元 。其格式为:'uXXXX',其中u是约定的前缀(u是unicode的第一个字母),而后面的XXXX位4位十六进制数,是该字元在unicode字元集中的序号 。例如:'uFFFF' 。转义符某些特殊的字元可以採用转义符来表示,如换行和制表符在源档案直接出现会被当做分隔设定、而不是做字元常量来使用,因而分别使用'n'和't'来转移,下面给出一些常见的Java程式中用到的转义符:n:换行符,unicode值为'u000a't:制表符,unicode值为'u0009'r:回车符,unicode值为'u000d'":双引号,unicode值为'u0022'':单引号,unicode值为'u0027'\:反斜槓,unicode值为'u005c'b:退格符,unicode值为'u0008'在Java中声明字元:char c1 = '一'; 即表示c1是一个字元 。