第三节 数据与编码
一、进制
(一)基本概念
数制即表示数值的方法,有非进位数和进位数两种。在计算机数制中,需要掌握数码、基数和位权
的概念。
数码:数制中表示基本数值大小的不同数字符号。在一种数制中,只能使用一组固定的符号来表示
数的大小。例如,十进制有 10 个数码,分别为 0,1,2,3,4,5,6,7,8,9 十个数。十六进制有 16
个数码,分别为 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F。
基数:一种数制所使用数码的个数。例如,十进制的基数为 10,十六进制的基数为 16。
位权:一个数值中某一位上的 1 所表示数值的大小。例如,十进制的 123,1 的位权是 10^2 ,2 的位
权是 10^1 ,3 的位权是 10^0 。
(二)进制表示
在计算机内部存储、处理和传递的信息均采用二进制代码来表示,二进制的基数为 2,只有“0”和
“1”两个数码。
除了二进制外,计算机中常用的还有八进制和十六进制。
对于不同的数制,我们常采用以下两种书写方式:
(1)在数字后面加一个大写字母作为后缀,表示该数字采用的数制;
(2)在括号外面加下标
二、不同进制之间的转换
(一)R 进制转换为十进制数
R 进制转换为十进制数,只要将各位数字乘以各自的位权求和即可。
转换规则:采用 R 进制数的位权展开法,即将 R 进制数按“位权”展开形成多项式并求和,得到
的结果就是转换结果,例如:
(1101) 2 =1×2 3 +1×2 2 +0×2 1 +1×2 0 =13
(二)十进制转换为 R 进制数
转换规则:整数部分(倒读法):“逐次除以基数取余”法,直到商为 0;
十进制转换二进制:(15) 10 转换成二进制数。
四、编码
通信的目的是为了交换信息,信息的载体可以是数字、文字、语音、图形、图像。由于计算机内部
只能处理二进制代码,因此,为了传输这些信息,首先要将这些信息转换成二进制。数值通过数制的转
换即可转换成计算机识别的二进制,而非数值型数据则需要遵循一定的编码标准进行编码从而被计算机
来识别。
(一)数值编码
数值在计算机中的表示形式称为机器数,一个数的最高位定义为符号位,其余位用来表示数值。常
用的机器数表示法有原码、反码和补码 3 种。
原码:机器数的最高位为符号位,正数为 0,负数为 1。数值部分为真值的绝对值。
反码:正数的反码与原码的表现方式相同;负数的反码是最高位为 1,数值位为原码逐位求反。
补码:正数的补码与原码的表现方式相同;负数的补码是把原码除符号位以外的各位取反,然后最
低位加 1,即“反码+1”。
(三)汉字编码
1.输入码
目前汉字主要是通过键盘输入到计算机中,汉字输入有不同的输入法,不同输入法对应着不同的编
码规则,这些编码规则就是汉字输入码,也称为外码。通常输入码是由键盘上的字符或数字组合而成,
有数字编码、拼音编码和字形编码,常见的有智能 ABC、五笔字型码、搜狗输入法等。
2.机内码
机内码是计算机系统内部处理和存储汉字时使用的代码。汉字可以选择不同的输入码,但是输入码
必须转换成统一的代码——机内码才能被计算机识别。每个汉字对应的机内码是唯一的。
3.字形码
字形码是显示或打印输出汉字时产生的字形,这种编码是通过点阵来实现的。全部的字形码都放在
汉字字库里。根据对汉字质量要求不同,常用的点阵有 16×16,24×24,32×32 及 48×48。每个点在
存储器中用一个二进制数存储,用“0”“1”分别表示“白”“黑”。根据点阵大小可计算出一个汉字所
需的存储空间。