1.1.1 消息、信息、数据和信号
在通信中,消息、信息、数据、信号等是经常使用的名词,在某些场合,它们也相互替换,混合使用。
1.消息(Message)
所谓消息,是指通信过程中传输的具体原始对象,例如,电话中语音,电视中的图像画面,电报中的电文,雷达中目标的距离、高度和方位,遥测系统中测量的数据等。很显然,这些语音、图像、电文、参量、数据、符号等消息在物理特征上极不相同,各种具体消息的组成亦不可能相同。
消息通常可以分成两大类:一类是离散消息,另一类是连续消息,它们的共同特点是都具有随机性,并且都可以进行度量。
离散消息和连续消息的统计特性归纳如下:
2.信息(Information)
信息在意义上与消息相似,但它的含义却更抽象。通信中通常把有用的消息认为是信息,消息可以包含信息,但消息不完全等于信息。信息在本质上看是事物的不确性的一种描述。例如,“今天中午我们去吃饭”这句话是消息,对消息的接收者来说,是经常发生的情况,可能没有什么信息;但如果是“今天中午我们吃满汉全席”,这一消息平常不可能出现,或出现的可能性很小,它可能就包含着较多的信息。可见,消息的有用程度与信息的多少有关系。消息出现的概率愈小,则消息中包含的信息就愈多。
信息可以进行度量,消息中信息的多少可直观地用信息量来衡量。根据香农(Shannon)的理论,对于离散消息,信息量I可表述为
表 1-1 模拟通信、数字通信、数据通信的区分
式中,P是离散消息发生的概率;对数的底数a决定着信息量I的单位:
在数据通信中,常以二进制(1和0)方式进行传输,因此,二进制的每个符号等概时所包含的信息量为
I=-log2(1/2)= 1(bit)
对于M进制、每个符号等概出现的消息,单一符号的信息量可表示成
对于更一般的情况,设消息是由一串(m个)符号构成的,若各符号的出现相互独立,则第i个符号的信息量为-log2 Pi,i=1,2,…,m。由于信息量具有相加性,则这个消息的信息量为
式中,ni为第i个符号出现的次数,Pi为第i个符号出现的概率,m为消息中符号的总数。
当组成消息的符号数目N很大很大时,第i个符号出现的次数,则它具有的信息量是-NPi log2 Pi bit,这个消息所具有的信息量是所有符号信息量的和,即
而其中一个符号的信息量(称为平均信息量H)为
平均信息量有时也称为熵(Entropy),这是因为 H的计算公式与热力学和统计力学中关于系统熵的公式相似的缘故。
可以证明,当消息中每个符号等概出现(P1=P2=…=Pm=P=1/m)时,H具有最大值:
在这种情况下平均信息量等于每一个符号的信息量I,此时式(1-6)与式(1-2)一致。值得说明的是,H的单位是比特/符号(bit/符号),而I的单位是比特(bit)。
如果已知一个消息的符号个数N和符号的平均信息量,则消息的总信息量为
例1-1 已知一消息源由A、B、C、D四个符号组成,它们出现的概率分别为、、和,且每个符号相互独立。消息源每秒输出2400个符号。试求A、B、C、D单个符号的信息量和消息源在1 min内的信息量。
解:各个符号的信息量I可用式(1-1)求得:
IA=IB=-log2(1/4)=2(bit)
IC=-log2(3/8)=1.415(bit)
ID=-log2(1/8)=3(bit)
每个符号的平均信息量H可通过式(1-5)求得:
消息源每秒输出2400个符号,则在1 min内共输出60×2400个符号,则1 min内的信息量
IΣ=N · H= 60 × 2400 × 1.905625 =274410(bit)
通过例1-1 可以看出,离散消息符号出现的概率愈小,则信息量愈大,可见消息的信息量与符号发生的概率值成减函数关系。另外,消息总的信息量与符号的多少成正比关系。
对于连续消息信息量的计算,可用下式计算:
式中P(x)为连续消息的概率密度函数,H(x)的单位为奈特。在数据通信中,由于数据是离散消息,故对连续消息信息量的计算不予详述。
3.数据(Data)
“数据”一词是人们日常工作和生活中使用频率很高的词,例如各种实验数据、测量数据、统计数据、计算机数据等。尽管人们经常遇见各种各样的数据,处理和运用数据,但数据很难严格地定义。一般可这样认为:数据是用来描述任何物体、概念、情况,且预先具有特定含义的数字、字母和符号。
在数据通信中,通常认为数据是指具有数字形式的数据,即由二进制或多进制数组成的数字序列(串)。从消息的概念来看,数据就是携带有用信息的离散消息。
4.信号(Signal)
信号是数据的表现形式,是消息的承载者。在通信中所使用的信号,指的是电信号或光信号,即随时间变化的电压、电流或光强。信号是通信系统中传输的主体,它存在于系统的每个环节中,因此,了解信号的特性及分析方法是非常有用的。信号分类和信号特性分别简要归纳如下: