1位、字节、字符、字符集.docx1位、字节、字符、字符集
1位、字节、字符、字符集
1 / 3
1位、字节、字符、字符集
1、位( bit):数据存储的最小单位。每个二进制数字 0 或者 1 就是 1 个
位;
2、字节1位、字节、字符、字符集
1位、字节、字符、字符集
1 / 3
1位、字节、字符、字符集
1、位( bit):数据存储的最小单位。每个二进制数字 0 或者 1 就是 1 个
位;
2、字节 (byte):8 个位构成一个字节;即: 1byte(字节 )=8bit(位);1 KB =
1024 B(字节 );1 MB = 1024 KB;(2^10 B)1 GB = 1024 MB;(2^20 B)1 TB = 1024 GB;(2^30 B)3、字符 (char):a、A、中、 +、* 、の ......均表示一个字符;一般 utf-8
编码下,一个汉字字符占用 3 个字节;一般 gbk 编码下,一个汉字字符占用 2
个字节; 4、字符集:即各种各个字符的集合,也就是说哪些汉字,字母( A、
b、 c)和符号(空格、引号 ..)会被收入标准中;
5、编码:规定每个 “字符 ”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做 “编码”。(其实际是对字符集中字符进行编码,即:每个字符用二进制在计算中表示存储);
通俗的说:编码就是按照规则对字符进行翻译成对应的二进制数,在计算器中运行存储,用户看的时候(比如浏览器),在用对应的编码解析出来用户能看懂的;
( 1)标准 ASCii字符集:有 96 个打印字符,和 32 个控制字符组成;一共96+32=128个;
用 7 位二进制数来对每 1 个字符进行编码;而由于 7 位还还不够 1 个字
节,而电脑的内部常用字节来用处理,每个字节中多出来的最高位用 0 替代;
0 000 0000....0 0 1111111..127;从 0----127,来表示 128 个 ACSii编码;比
如:字符 'A'--在内部用 0100 0001(65)来表示;字符 'a'---在内部用 0110 0001
97)来表示;注意: '10'在计算器内部是没有编码的,因为它是字符串,而不是单个字符。可以分别对 1,0 字符编码存储;
( 2)扩展 ASCii字符集:将标准的 ASCii最高位 1,得到十进制代码 128---
255(1 000 0000----1 111 1111);所以字符集一共有 0---255,256 个字符;
3)gb2312 字符集 :所有汉字字符在计算机内部采用 2 个字节来表示,每个字节的最高位规定为 1【正好与标准 ASCii字符(最高位是 0)不重叠,并兼容】,不支持繁体字;
1 / 3
1位、字节、字符、字符集
1位、字节、字符、字符集
3 / 3
1位、字节、字符、字符集
所以: gb2312 表示汉字的编码为: [129--255][129--255](两个字节,每个字节最高位是 1);小于 127 的字符
1位、字节、字符、字符集 来自淘豆网m.daumloan.com转载请标明出处.