何为数据,信息

最近在学习GIS中,注意到名词中反复出现的两个词 “数据” 和 “信息”, 观察到有的句子中使用数据一词,而有的则使用信息一词, 博主以前并未仔细探讨过两者的异同, 总是隐约的区分, 现在感觉不能再这样了, 是时候仔细区分一下两者了, 主要也是方便学习中的名词记忆, 哈哈!

通俗的说:
数据: 是能存储到计算机里的内容,包括数字,文字,图片等
信息: 数据里所涵盖的内容
数据经过加工可以提炼出信息

以下为更为详细严谨的解释:

正文开始

有一句话是这么说的“数据是爆炸了,信息却很贫乏”,那么数据信息之间到底有什么关系呢?

联系

数据和信息之间是相互联系的。数据是反映客观事物属性的记录,是信息的具体表现形式。数据经过加工处理之后,就成为信息;而信息需要经过数字化转变成数据才能存储和传输。

区别

那么,数据是否就是指可以存储和传输的信息呢?未必!数据和信息是有区别的。从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。数据是数据采集时提供的,信息是从采集的数据中获取的有用信息。

图1 数据与信息的关系

​ 图1 数据与信息的关系

由此可见,信息可以简单地理解为数据中包含的有用的内容。不严格的说,“不知道的东西,你知道了,就获得了一个信息”。

定量分析

上面定性分析了数据和信息之间的区别和联系,下面对数据和信息进行定量分析。数据量和信息量之间会有什么联系呢?是不是数据量越大,其中包含的信息量就越多呢?不一定。比如,有人说“人的嘴巴上方有鼻子,鼻子上方有眼睛”,因为这是预料中的事,所以你从这个消息中得到的信息量很少。但如果有人说“人的鼻子上方有嘴巴,嘴巴上方有眼睛”,就会让人很震惊,因为这是预料之外的,这样的信息量就很大。这说明了:一个消息越不可预测,它所含的信息量就越大。

事实上,信息的基本作用就是消除人们对事物了解的不确定性。信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。从这个定义看,信息量跟概率是密切相关的。在概率论中,用P(x)表示在N个相等的可能事件出现某一个事件的概率,即P(x)=1/N。信息量I(x)定义为:

​ I(x)=log2N = -log2(1/N )= -log2P(x)

结合概率论知识,推而广之,可以用下面的公式——称之为熵H(x)公式来表示一大堆数据带来的平均信息量。

注意:这个平均信息量不是算术平均,是概率论的统计平均——数学期望值。

LLQ wechat
扫一扫上面的二维码可以关注我哦
坚持技术分享,您的支持将鼓励我继续创作!