ASCⅡ ASCII


ASCⅡ ASCII

文章插图
ASCII(ASCⅡ)【ASCⅡ ASCII】ASCII(American Standard Code for Information Interchange:美国信息交换标準代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言 。它是现今最通用的信息交换标準,并等同于国际标準ISO/IEC 646 。
请注意,ASCII是American Standard Code for Information Interchange缩写,而不是ASCⅡ(罗马数字2),有很多人在这个地方产生了误解 。
基本介绍中文名:美国信息交换标準代码
外文名:American Standard Code for Information Interchange
简称:ASCII
别称:ASCII代码
类别:编码标準
作用:显示现代英语和其他西欧语言
产生原因在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那幺大家就必须使用相同的编码规则,于是美国有关的标準化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示 。美国标準信息交换代码是由美国国家标準学会(American National Standard Institute , ANSI )制定的,标準的单位元组字元编码方案,用于基于文本的数据 。起始于50年代后期,在1967年定案 。它最初是美国国家标準,供不同计算机在相互通信时用作共同遵守的西文字元编码标準,它已被国际标準化组织(International Organization for Standardization, ISO)定为国际标準,称为ISO 646标準 。适用于所有拉丁文字字母 。表述方式ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字元 。标準ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字元 。其中:0~31及127(共33个)是控制字元或通信专用字元(其余为可显示字元),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字元:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字元 。它们并没有特定的图形显示,但会依不同的应用程式,而对文本显示有不同的影响 。32~126(共95个)是字元(32是空格),其中48~57为0到9十个阿拉伯数字 。65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等 。同时还要注意,在标準ASCII中,其最高位(b7)用作奇偶校验位 。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种 。奇校验规定:正确的代码一个位元组中1的个数必须是奇数,若非奇数,则在最高位b7添0;偶校验规定:正确的代码一个位元组中1的个数必须是偶数,若非偶数,则在最高位b7添1 。后128个称为扩展ASCII码 。许多基于x86的系统都支持使用扩展(或“高”)ASCII 。扩展ASCII 码允许将每个字元的第8 位用于确定附加的128 个特殊符号字元、外来语字母和图形符号 。标準表Bin(二进制)Oct(八进制)Dec(十进制)Hex(十六进制)缩写/字元解释0000 00000000x00NUL(null)空字元0000 00010110x01SOH(start of headline)标题开始0000 00100220x02STX (start of text)正文开始0000 00110330x03ETX (end of text)正文结束0000 01000440x04EOT (end of transmission)传输结束0000 01010550x05ENQ (enquiry)请求0000 01100660x06ACK (acknowledge)收到通知0000 01110770x07BEL (bell)响铃0000 100001080x08BS (backspace)退格0000 100101190x09HT (horizontal tab)水平制表符0000 1010012100x0ALF (NL line feed, new line)换行键0000 1011013110x0BVT (vertical tab)垂直制表符0000 1100014120x0CFF (NP form feed, new page)换页键0000 1101015130x0DCR (carriage return)回车键0000 1110016140x0ESO (shift out)不用切换0000 1111017150x0FSI (shift in)启用切换0001 0000020160x10DLE (data link escape)数据链路转义0001 0001021170x11DC1 (device control 1)设备控制10001 0010022180x12DC2 (device control 2)设备控制20001 0011023190x13DC3 (device control 3)设备控制30001 0100024200x14DC4 (device control 4)设备控制40001 0101025210x15NAK (negative acknowledge)拒绝接收0001 0110026220x16SYN (synchronous idle)同步空闲0001 0111027230x17ETB (end of trans. block)结束传输块0001 1000030240x18CAN (cancel)取消0001 1001031250x19EM (end of medium)媒介结束0001 1010032260x1ASUB (substitute)代替0001 1011033270x1BESC (escape)换码(溢出)0001 1100034280x1CFS (file separator)档案分隔设定0001 1101035290x1DGS (group separator)分组符0001 1110036300x1ERS (record separator)记录分隔设定0001 1111037310x1FUS (unit separator)单元分隔设定0010 0000040320x20(space)空格0010 0001041330x21!叹号0010 0010042340x22"双引号0010 0011043350x23#井号0010 0100044360x24$美元符0010 0101045370x25%百分号0010 0110046380x26&和号0010 0111047390x27'闭单引号0010 1000050400x28(开括弧0010 1001051410x29)闭括弧0010 1010052420x2A*星号0010 1011053430x2B+加号0010 1100054440x2C,逗号0010 1101055450x2D-减号/破折号0010 1110056460x2E.句号0010 1111057470x2F/斜槓0011 0000060480x300字元00011 0001061490x311字元10011 0010062500x322字元20011 0011063510x333字元30011 0100064520x344字元40011 0101065530x355字元50011 0110066540x366字元60011 0111067550x377字元70011 1000070560x388字元80011 1001071570x399字元90011 1010072580x3A:冒号0011 1011073590x3B;分号0011 1100074600x3C<小于0011 1101075610x3D=等号0011 1110076620x3E>大于0011 1111077630x3F?问号0100 00000100640x40@电子邮件符号0100 00010101650x41A大写字母A0100 00100102660x42B大写字母B0100 00110103670x43C大写字母C0100 01000104680x44D大写字母D0100 01010105690x45E大写字母E0100 01100106700x46F大写字母F0100 01110107710x47G大写字母G0100 10000110720x48H大写字母H0100 10010111730x49I大写字母I010010100112740x4AJ大写字母J0100 10110113750x4BK大写字母K0100 11000114760x4CL大写字母L0100 11010115770x4DM大写字母M0100 11100116780x4EN大写字母N0100 11110117790x4FO大写字母O0101 00000120800x50P大写字母P0101 00010121810x51Q大写字母Q0101 00100122820x52R大写字母R0101 00110123830x53S大写字母S0101 01000124840x54T大写字母T0101 01010125850x55U大写字母U0101 01100126860x56V大写字母V0101 01110127870x57W大写字母W0101 10000130880x58X大写字母X0101 10010131890x59Y大写字母Y0101 10100132900x5AZ大写字母Z0101 10110133910x5B[开方括弧0101 11000134920x5C\反斜槓0101 11010135930x5D]闭方括弧0101 11100136940x5E^脱字元0101 11110137950x5F_下划线0110 00000140960x60`开单引号0110 00010141970x61a小写字母a0110 00100142980x62b小写字母b0110 00110143990x63c小写字母c0110 010001441000x64d小写字母d0110 010101451010x65e小写字母e0110 011001461020x66f小写字母f0110 011101471030x67g小写字母g0110 100001501040x68h小写字母h0110 100101511050x69i小写字母i0110 101001521060x6Aj小写字母j0110 101101531070x6Bk小写字母k0110 110001541080x6Cl小写字母l0110 110101551090x6Dm小写字母m0110 111001561100x6En小写字母n0110 111101571110x6Fo小写字母o0111 000001601120x70p小写字母p0111 000101611130x71q小写字母q0111 001001621140x72r小写字母r0111 001101631150x73s小写字母s0111 010001641160x74t小写字母t0111 010101651170x75u小写字母u0111 011001661180x76v小写字母v0111 011101671190x77w小写字母w0111 100001701200x78x小写字母x0111 100101711210x79y小写字母y0111 101001721220x7Az小写字母z0111 101101731230x7B{开花括弧0111 110001741240x7C|垂线0111 110101751250x7D}闭花括弧0111 111001761260x7E~波浪号0111 111101771270x7FDEL (delete)删除 大小规则数字的ASCII码<大写字母的ASCII码<小写字母的ASCII码 。查询ASCII技巧,方便查询ASCII码对应的字元:新建一个文本文档,按住ALT+要查询的码值(注意,这里是十进制),鬆开即可显示出对应字元 。例如:按住ALT+97,则会显示出'a' 。出现问题ASCII是美国标準,所以它不能良好满足其它讲英语国家的需要 。例如英国的英镑符号(£)在哪里?拉丁语字母表重音符号使用斯拉夫字母表的希腊语、希伯来语、阿拉伯语和俄语 。汉字系统的中国象形汉字,日本和朝鲜 。1967年,国际标準化组织(ISO:International Standards Organization)推荐一个ASCII的变种,代码0x40、0x5B、0x5C、0x5D、0x7B、0x7C和0x7D“为国家使用保留”,而代码0x5E、0x60和0x7E标为“当国内要求的特殊字元需要8、9或10个空间位置时,可用于其它图形符号” 。扩展1. 1981年IBM PC ROM256个字元的字元集,即IBM扩展字元集2. 1985年11 Windows字元集被称作“ANSI字元集”,遵循了ANSI草案和ISO标準(ANSI/ISO8859-1-1987,简“Latin 1” 。3. 1987年4月代码页437,字元的映像代码,在MS-DOS3.3出现 。扩展ASCII 字元是从128 到255(0x80-0xff)的字元 。扩展ASCII不再是国际标準 。4. 双位元组字元集(DBCS:double-byte character set),解决中国、日本和韩国的象形文字元和ASCII的某种兼容性 。DBCS从256代码开始,就像ASCII一样 。与任何行为良好的代码页一样,最初的128个代码是ASCII 。然而,较高的128个代码中的某些总是跟随着第二个位元组 。这两个位元组一起(称作首位元组和跟随位元组)定义一个字元,通常是一个複杂的象形文字 。常用ASCII码ESC键:VK_ESCAPE (27)回车键:VK_RETURN (13)TAB键:VK_TAB (9)Caps Lock键:VK_CAPITAL (20)Shift键:VK_SHIFT (16)Ctrl键:VK_CONTROL (17)Alt键:VK_MENU (18)空格键:VK_SPACE (32)退格键:VK_BACK (8)左徽标键:VK_LWIN (91)右徽标键:VK_RWIN (92)滑鼠右键快捷键:VK_APPS (93)Insert键:VK_INSERT (45)Home键:VK_HOME (36)Page Up:VK_PRIOR (33)PageDown:VK_NEXT (34) End键:VK_END (35)Delete键:VK_DELETE (46)方向键(←):VK_LEFT (37)方向键(↑):VK_UP (38)方向键(→):VK_RIGHT (39)方向键(↓):VK_DOWN (40)F1键:VK_F1 (112)F2键:VK_F2 (113)F3键:VK_F3 (114)F4键:VK_F4 (115)F5键:VK_F5 (116)F6键:VK_F6 (117)F7键:VK_F7 (118)F8键:VK_F8 (119)F9键:VK_F9 (120)F10键:VK_F10 (121)F11键:VK_F11 (122)F12键:VK_F12 (123)Num Lock键:VK_NUMLOCK (144)小键盘0:VK_NUMPAD0 (96)小键盘1:VK_NUMPAD1 (97)小键盘2:VK_NUMPAD2 (98)小键盘3:VK_NUMPAD3 (99)小键盘4:VK_NUMPAD4 (100)小键盘5:VK_NUMPAD5 (101)小键盘6:VK_NUMPAD6 (102)小键盘7:VK_NUMPAD7 (103)小键盘8:VK_NUMPAD8 (104)小键盘9:VK_NUMPAD9 (105)小键盘 。:VK_DECIMAL (110)小键盘*:VK_MULTIPLY (106)小键盘+:VK_ADD (107)小键盘-:VK_SUBTRACT (109)小键盘/:VK_DIVIDE (111)Pause Break键:VK_PAUSE (19)Scroll Lock键:VK_SCROLL (145)汉字编码国标码区位码在计算机中一个汉字通常用两个位元组的编码表示,我国制定了“中华人民共和国国家标準信息交换汉字编码字元集(基本集GB2312—1980)”,简称国标码,是计算机进行汉字信息处理和汉字信息交换的标準编码 。在该编码中,共收录汉字和图形符号7445个,其中一级常用汉字3755个(按汉语拼音字母顺序排列),二级常用汉字3008个(按部首顺序排列),图形符号682个 。在GB2312—1980中规定,全部国标汉字及符号组成一个94×94的矩阵 。在此矩阵中,每一行称为一个“区”,每一列称为一个“位” 。于是构成了一个有94个区(01~94区),每个区有94个位(01~94位)的汉字字元集 。区码与位码组合在一起就形成了“区位码”,唯一地确定某一汉字或符号 。区位码的分布规则如下:1)01~09区:图形符号区 。2)10~15区:自定义符号区 。3)16~55区:一级汉字区,按汉字拼音排序,同音字按笔画顺序 。4)56~87区:二级汉字区,按偏旁部首、笔画排序 。5)88~94区:自定义汉字区 。汉字输入码所谓汉字输入码就是用于使用西文键盘输入汉字的编码 。每个汉字对应一组由键盘符号组成的编码,不同的汉字输入法其输入码不同 。汉字输入码也称外码 。常见的汉字输入编码方案可分为如下4类:1)数码:用数字组成的等长编码,典型代表有区位码、电报码 。2)音码:根据汉字的读音组成的编码,典型代表有全拼码和双拼码 。3)形码:根据汉字的形状、结构特徵组成的编码,典型代表有五笔字型、表形码 。4)音形码:将汉字读音与其结构特徵综合考虑的编码,典型代表有自然码、首尾拼音码 。汉字内码无论用户用哪种输入法,汉字输入到计算机后都转换成汉字内码进行存储,以方便机内的汉字处理 。汉字内码是採用双位元组的变形国标码,在每个位元组的低7位与国标码相同,每个位元组的最高位为1,以与ASCII码字元编码区别 。汉字字形码汉字字形码(汉字输出码)是将点阵组成的汉字模型数位化,形成一串二进制数称为汉字字形码,其主要用于输出汉字 。输出汉字时,将汉字字形码再还原为由点阵构成的汉字,所以汉字字形码又被称为汉字输出码 。汉字是一种象形文字,每一个汉字可以看成是一个特定的图形,这种图形可以用点阵、 轮廓向量、骨架向量等多种方法表示,而最基本的是用点阵表示 。如果用16x16点阵来表示 一个汉字,则一个汉字占16行,每一行有16个点,其中每一个点用一个二进制位表示,值“0” 表示暗,值“1”表示亮 。由于计算机存储器的每个位元组有8个二进制位,因此,16个点要用 两个位元组来存放,16x16点阵的一个汉字字形需要用32个位元组来存放,这32个位元组中的信息 就构成了一个16x16点阵汉字的字模 。