王育民:信息化社会与信息安全
来源:华商网 更新时间:2012-04-14

 
西安电子科技大学教授、博士生导师王育民发表演讲 实习记者 王丹

   在7月16日举行的2011中国(西安)信息安全产业高峰论坛暨陕西国家信息安全产业园项目启动仪式上,西安电子科技大学教授、博士生导师王育民发表了以《信息化社会与信息安全》为主题的精彩演讲,以下是演讲实录:


  首先热烈祝贺2011中国(西安)信息安全产业高峰论坛开幕暨陕西国家信息安全产业园项目启动,很高兴能有这样的机会和大家一起交流。我今天讲的大概有这么几个内容,第一个就是信息论与数字化革命,第二个就是信息空间与信息化社会的形成,第三个就是信息化社会的特点,第四个是信息化社会的挑战,第五个就是信息安全的理论与技术。

  由于时间关系,有些我可能不会讲得很详细,首先我们看信息论与数字化革命,首先讲信息与信息量的概念,我们生活在信息化社会,都知道信息二字,天天是不离口,信息这个概念是非常范的概念和词语,可以在它前面贯上技术的定语,构成不同的信息,比如说科技信息、体育信息等等,信息可以被感知,但是不是所有的信息都可以定量计数,因此,我们要区分信息和信息量的不同之处,有人曾经做过总结,从数学上来说,已经有了关于信息量的定义,大概有100多种,这是80年代信息论开全国会议的时候,有一个研究员总结了,如果将信息提升到科学进行研究,第一步要对信息进行定量,给出信息的科学测度,但是这并不是一件很容易的事情。

  信息是多样的,客观事物是多种多样的、五花八门的,事物的状态和变化是多姿多彩、变幻无穷的,属性不同就出现了不同的信息,需要给出不同的信息定义,从而可创建不同的信息理论,比如说信息的不确定性,引出了概率信息,这是我们讲的最多的。

  第二个是信息的模糊性,引出了模糊信息和模糊信息论,这个在70年代末提出来的,比如信息的量子属性,引出了量子信息和量子信息论,对量子信息论有不同的争论。

  信息的复杂性引出了信息的复杂度和复杂度的信息理论,信息的感知属性引出了感知信息和感知信息理论,信息的美学属性引出美学信息和美学信息理论等等,非常多。

  现在有五花八门的信息理论,已经提出了各式各样的信息理论,而且得到了众多不同的结果,都宣称取得了成功,动态信息论、定性信息论、经济信息论、算法信息论、模糊信息论、量子信息论等等,还有信息生态学、信息代数、信息几何等,信息物理学、信息生物学等。

  我们首先看信息量度定义的困难性,在众多信息中,只有少数的信息有了量,大多数的信息是可以感知的,但是无法度量,因为没有找到合适的信息量的定义,就建不起来一套理论,比如说对情感信息中的喜怒哀乐,都可以感知,但是我们很难度量它们,我们只能用一些比较模糊的形容词,描述不同程度的感情,我们不能给出这份爱有多少比特,那份爱比这份爱多了多少比特。

  对美学信息有很强的主观性,一张画这个人觉得画得非常好,另外一个人看不懂,这是抽象派的画,觉得一钱不值,这里有很大的困难性,要给出一个客观的量度来度量美学信息。

  由于客观信息的多样性,要想给出一个能够包罗万象的统一定义,在此基础上建立起一套信息理论几乎是不大可能的。

 第二个介绍一下SHANNON信息论,文章指出了通信系统的模型,用概率和统计观点描述信道的干扰等,给了不确定的信息量度,并明确指出了客观有效、可靠的信息通信之路,就是要搞数字化和编码,宣告了一门学科信息论的诞生,成为通信领域技术革命的思想或者理论基础。

  这个人活了84岁,在2001年去世的,1946年计算机和1947年晶体管的诞生和相应技术的发展,是这一革命的物理和物质基础,不确定信息是对信息亮度定义为商差,比如说一个人要住院生小孩,到底生男孩还是女孩,没有生之前可能性大概都是二分之一,当然除了用现代的B超,不准透露信息,生了以后看到是一个男孩,就告诉她。


  不确定信息的研究又是研究其他信息属性的基础,因为通信的基本目的,就是在此时彼地或彼时彼地获得信源的输出,由于有了存储器以后,发展出来的一个新的内涵。过去通信都是实时的,现在可以非实时的通信,可以存储通信。这个信息量有一定局限的值,描述了不确定信息,我们研究的通信质量来说,我们研究听音乐,要把音乐传到对方去的时候,如果你要求的高,你付出的代价就要大,量化的比特就要大,不能8比特量化,现在要12比特量化,甚至24比特量化,24比特量化你付出的代价,存储和传输付出的代价都大,比较大就使得保证了对于美学的需要。

  比如说过去我们听数字音乐的时候,大家不太想听CD,哪怕我听胶片的,噪音很大,但是觉得这是原汁原味的,随着量化比特的增加,现在用蓝光存储,存储量很大了,可以更精细的进行音乐采量的量化,现在没有人说蓝光唱片还有数字味,过去数码相机不能参加摄影比赛的,但是现在的话,数码相机1200万象素,甚至5000、6000万象素,照出来跟胶片已经分辨不出来了,付出了代价以后,我们研究通用技术,用信息论定义的量,研究通信系统,仍然是可以照顾到这个的。

  如果说照片美的程度好坏,可能有很多主观因素,从美学的角度到底美到多少,没有定量,但是从传输质量上,已经可以完全满足要求的。

  下面要稍微讲几个概念,不是搞通信的人含糊不清的,什么叫符号,什么叫消息,什么叫数据,什么叫信息,这些都是不同的概念,所以这个方面的话可能需要搞清楚一些,比如说现在很多人,什么叫知识,有的人说信息可能就是知识,什么叫智慧,这里是不一样的,人们在社会实践中获得经验的综合这是知识,具有已经被证实为真,并被相信的特征,这是知识,被大家相信的东西。

  智慧是辨别发明创造的能力,就是认识和改造世界的能力,我们从数据里面是可以提取到信息的,但是不能说信息就等于数据,信息是经过加工提炼可以成为知识的,但是知识的话呢,是不等于信息本身,而且知识的话,也不等于智慧。知识多的人不一定都很有智慧,书读得少的人,未必智慧就少,这个大家都知道,当代人未必就比2500年前的孔夫子更有智慧性。我还要说一句,什么是信息科学和信息技术,这里简单讲一下,以信息的运动规律和应用方法为主要研究内容,以计算机等技术为研究工具,以扩展人类信息功能为目标的综合学科就是信息科学,信息科学是由计算机科学、仿生学等学科渗透形成的,信息技术的话,就是实现信息获取、存储、处理以及标准化的有关技术,具体包括了通信、控制、计算机、软硬件、电子器件、光和量子技术等等。

  第二个话就是信息空间和信息化社会的形成,这里主要有两个内容,一个是信息化社会,一个是信息空间的基本构成。首先我们来看看信息化社会,信息论问世到现在已经有60多年了,到了今天通信计算机、半导体技术的发展,已经将人类推进到信息时代,上个世纪70到80年代完成了通信和计算机的结合,英特尔的出现,是上个世纪80年代出现,加上90年代开始的通信计算机和消费电子结合,这三个字在英文里面都是C字打头,所以叫3C。

  后来大概叫全球信息基础设施,构成了人类生存的信息环境,有一个名词叫信息空间,这个虚拟的空间的形成和发展,将人类社会推进到了一个新的发展阶段,即信息化社会阶段。

信息空间的基本构成,我们画了一个图,这个图的话就是说,英特网还有跟英特网相连接的叫内网,内网里面的话,不是所有的东西都面向英特开放的,有一部分只对内部开放的,但是要借助英特和其他内网相连通,所以这就是内网,内网本身它不是地理的一个划分,是在一个虚拟空间里的划分,比如说我们的外交部,可能在全世界的话,它自己有一个外交部的内网,但是他分布的范围,可能是世界性的,凡是跟我们有外交关系的国家里面,我们这个网都涉及到。

  再有就是专用业务网,就是不跟英特网连接的,比如说很多军事通讯的网是不跟英特网连接的,我们的政府有些机要的网也不跟英特网连接的,我们这里提的信息空间和信息空间中各种不同的子空间,这个是从数学上来讲的一个数学概念,云计算的话,云的概念可能更物理一些,但是我觉得要从抽象的来看,这上面没有太大的本质的区别。


  第三个就是信息化社会的特点。

  这里主要是这么几点,一个是信息的普遍性和重要性,第二个信息化社会中的数据爆炸,第三个就是信息大战,第四个信息空间中的生存和竞争,第五个是数字化和虚拟化的问题。

  现在我们知道,我们所设计的都是数据,而且数据量越来越大,我们的存储器的单位,过去我们用兆,70、80年代,一个软盘64兆、32兆,发展以后觉得兆不够了,用G比特,现在G也不够了,要用T来描述,再进一步的发展,就到了P,如果人们描述现在的英特网存在的数据有多少的话,P都不够,就得用什么呢?E,就是十的18次方字节。

  第一个就是信息的普遍性和重要性,在信息化社会中信息已经是无处不在、处处在,信息的作用越来越大,信息对社会的需求越来越大,社会对信息的需求越来越大,通讯、广播、出版等从模拟到数字,从单一媒体到多媒体,从人工、机械化到智能化,大大加速了人类社会的进程,有人预计到2025年,所有的传输都将数字化,灵巧的个人终端将为人们提供各种各样的服务,个人终端通过几十米、几公里的无线信道连接世界。

  信息化社会中,一个国家、一个地区、一个单位、一个人,没有好的信息基础设施,它在现代信息社会的激烈竞争中,就会落后和失败,信息和信息技术是维系、管理社会和经济运行的重要手段。信息业的产值占的比例也越来越大,今天上午已经有人报告了这个方面的一些数据。

  第二个方面就是在信息化社会中的数据爆炸,如果将互联网的内容抄录到A4纸上,如果把它堆垒起来的高度,将是从地球到冥王星距离的10倍,现在的话,认为冥王星并不是一个行星,这是新的天文学的论述,全球最大的美国国会图书馆,查阅的书籍达到1.4亿册,这个量只是互联网上信息量的千万分之一,人类社会每年新增数据量约为1到2EB,其中包括了所有信息存储的书记、杂志、文件等,总计的数据量不到英特网数据量的百分之一。

  如果我们在网上搜索信息这个词,用GOOGLE搜索,0.33秒就给出3710000000条,数据爆炸是现实的,信息爆炸尚可言,这不是知识爆炸的时代,知识我们只能是一点点的积累,知识的积累它是一点一滴的,不要以为英特网上存的数据都是知识,那是大量的知识的重复。

  比如说量子力学,提出到现在将近百年,积累的书不知道有多少,几千种以上,但是实际上这几千种都在写这么长时间里,人类对量子的认识,就是可以写成一本书就行了。所以的话,我们远远不是知识爆炸,知识爆炸就不得了了,所以,在信息化社会中,信息、信息与科学技术已经渗透到人类生活的各方面。

  第三个特点就是信息大战,我们知道信息化社会导致第三次军事革命,联合作战和信息作战成为主要的作战形式,数字化部队和数字化战场的诞生,信息和技术在战争中起的作用越来越大,最近军队已经把总参通讯部,已经改名为总参信息化部,如果大家注意的话呢,拉登这个问题,网上有一张照片,美国总统和希拉里在一个房子里面,在实时的获取网络上的信息,在那研究对策然后做出决定,未来的指挥战争,就可以从这里看出来信息的作用和重要性。

第四个就是信息空间中的生存和竞争,信息化社会中人们的一切活动都将在信息空间中进行竞争和接受考验,而且的话呢,现在的话,大家都感到有一个很现实的感觉,就是我们做研究工作的人,我们的博士生,就是到图书馆的次数越来越少,和我们那时候做学生的时候,已经完全不一样,我们那时候做学生,完全是靠在图书馆翻书看书,比如说要看一本原版的杂志,从美国运到咱们国家,送到图书馆大概要3、4个月,比如说现在我们要看美国出版的,我们需要的杂志,需要它一出版立刻在网上就可以看到,就可以查到,而且我们现在的学生所依靠的,并不是这些杂志上发表的文章了,而是在网络上公布的一些最新的结果,所以,学生一定要让他们上网,让他们了解到世界上哪些人在搞这方面的题目,跟他们来讨论,才能做出新的东西,因为知识的创新,科学上的创新,只有第一没有第二,跟运动还不一样,运动第二还有奖,科学上你是第二的话,你就落后了,这个上面的竞争是非常激烈的。

  第五个就是数字化和虚拟化,信息化社会的很多有形东西向无形的数字方向转变,人类的生存越来越依赖虚拟世界了。要考察每个上网的人,他都有他的特点,你要把他的特点提出来,就像把一个人的遗传密码提出来一样,就是EDNA,要在虚拟空间中取证和追踪一些问题,这个很厉害。


  下来就是信息化社会的挑战。数据过量,难以消化。美国纽约时报从60年代的10到20版扩展到现在的100版到200版,我现在基本上不看报,就是网络上看消息,来搜索所需要的东西,现在的特点是什么呢?数据生产传输能力,远远大于人们的数据分析能力,人们被数据淹没,人们找不到所需要的知识,要在信息大海里捞针,不是一件容易的事。

  第二个特点就是信息真假难以辨别,有真实的信息,也有欺诈的信息,有错误的信息,还有虚假的信息,还有伪信息等等,都要进行分析和识别,提取出真正有价值的信息,对网上的信息要进行分析,这是相当困难的事情,美国这方面是非常先进的,如果看上某一个人,比如说这个人从西海岸登陆,可以一直追踪,中间在哪住,在哪租的汽车,在哪个银行取过钱都可以知道,这是对你看准的一个人,但是进出美国的人,都是数以千万计,要对每个人进行这样的跟踪是不可能的,所以美国虽然有全球的监测,但是对拉登的监测,拉登已经存活了这么多年,从一个山洞跑到另一个山洞,我认为他后来被逮住,是因为他定居在巴基斯坦,他没有动态的变化,最后给他定位了。

  第三点,信息的表示不一致,难以统一处理,多媒体编码的问题,数据挖掘、检索、提取的问题,都需要进行很好的研究,这方面需要多方面的科学家,比如说需要数学家、计算机科学家、图书馆学家统一做这件事情,能够最简单的把信息表示出来,你要找到这种办法才行,现在最难的是对图象的查找和处理能力。比如说信息的表示,我们中国的算术水平应该是很高的,搞数学的智慧还是比较高的,但是我们在数的表示上,我们没有发明阿拉伯数字,我们做算术、算式运算的时候,就是非常的烦琐,发明了阿拉伯数字表示以后,算术表示就非常得简单,信息的表示是非常重要的。

  再举一个例子,比如说音乐里面,我们是把外国的音乐,发明了一种大众容易接受的简谱,但是你要真是学音乐的人,学西洋音乐的人,如果不懂得五线谱,你弹钢琴、拉小提琴是非常难的,信息的表示是非常重要的一件事情。

  第四个话就是信息空间的安全、可信难以保证,这个大家讲的很多了。

  第五个就是信息社会中的消沉和沦落,人们在网上浏览新闻、查阅资料等,每天余下来的时间读点文献、做研究的时间越来越少,很容易变得越来越浮躁,这对于做研究是很有害的,常常会使我们疏远了物理世界,忘记了自己的使命和当前要解决的问题,研究工作要静下心来,阅读、试验等等,特别是一些数学研究,有时候需要数月、数年如一日的研究,才可以突破。

  更有甚者,不少人可能经不起网上不良信息的诱惑,走上邪路,有的沉迷于网络游戏,毁了美好前程。我们要学会在信息大海中弄潮,充分利用网络查阅自己所需要的信息,在研究工作中,任何时间保持清醒的头脑,不追星、不跟风,任何时候都能坚持独立的人格和自由的思想,这样才可以真正的追求真理、探索真理,才有希望做出好的结果。

  我觉得对于青少年的教育更是如此,我们要把青少年对于计算机的热爱,对于网络的热爱,走到正路上来。我看到一些美国的材料,我觉得他们的教育还是比我们好得多,比如他们有一些中学生,对网络游戏是非常迷的,也是成夜的搞,搞一搞最后觉得光搞人家的没意思,该开始自己设计游戏,兴趣进去了以后就更提出了要求,他要打败比尔盖茨,要创造适合现代网络发展的更新的软件和操作系统,就有这样的志向,我们整个的教育,应该创造一些条件,今天网络攻击还是起了一点作用,希望这样的活动能多开展。

  第六个挑战就是信息化社会是很不稳定的,比如说我们在核武器时代,原子武器时代,要掌握原子武器,要用这个来破坏社会,这个可能性是很小的,因为发射井的控制不是一个人,两个以上的人要对钥匙的,总统有密码箱,要授权,密码箱到哪,都得有人提着,但是在信息化社会,一个很聪明的、智商很高的小孩,他有一台计算机,可以联网,就可以在信息空间中大脑填空,美国防卫最严的国防网络都可以攻进去,前几年发生过很多网络攻击事件,造成的影响是很大的,为什么呢?信息化社会的话,大家在网络空间里面大闹一下,这个门槛太低,这个社会要保持信息安全,要保持社会稳定,要比其他任何以前的社会要来得困难。

最后一个问题,我们讲讲信息安全的理论和技术,这里主要讲讲信息数据和信息系统,第二个是信息论、密码学和信息安全,第三个信息安全的内涵,第四个就是讲密码学、密码技术、信息安全技术和信息系统安全技术。

  1、信息数据和信息系统,要明确我们研究的信息安全问题,我们要先明确信息数据和信息系统的基本含义,虽然当今信息化社会中,信息在这个技术过程中起着重要的作用,人们每天信息二字不离口,到今天还没有一个大家工人的信息的定义,我们仍然不知道信息是什么,尽管在数学上已经给出了不下百种的定义。


  威尼尔曾经说过一句话,什么叫信息呢?在控制论里这样说,信息既不是物质,也不是能量,信息就是信息,虽然没有给出信息本身的定义,但是是第一次将信息的重要性提到了空前未有的高度,成为构成系统的三大要素之一,信息可以感知,但是难以定义概念,信息是抽象的、无形的,物质和能量是系统的躯体,信息是系统的灵魂,信息要借助物质和能量,才能传输感知,物质和能量要借助信息才能表述和控制。

  数据,对可以存储、处理的实体事物的描述,可以是语言、文学、图形、表格、视频、多媒体等形式,是消息和信息的载体。

  信息系统,用于采集、传输、存储、计算或管理数据的系统,如通信系统、计算机系统、感知系统、网络系统等。

  我们称数据系统更切合实际,我们所谓的信息安全,实际上指信息系统中数据的安全,但考虑到人们已经习惯的称呼,我们也将其称作是信息系统和信息安全,实际上我认为我们应该叫它数据系统和数据安全。

  最早的一本信息安全的数,就叫《密码学和数据安全》。

  第二个信息论、密码学与信息安全,信息论的话呢,信息论研究噪声干扰下的通信科学,由于噪声的存在,为了抗击噪声,实现有效的通信,才诞生了信息论,系统中没有噪声,要实现通信就轻而易举。信息论的核心是借助编码,这是一种广义的编码,包括信道编码、调制解调等,实现有效通信,信息论追求的主要是通信的可靠性和有效性。

  密码学的话呢,对于密码学给出一个相仿的定义,什么是密码学呢?就是研究有敌手参与的通信,这个定义大致上不错,但是应该稍加修改。密码学是研究有对手参与下的安全通信的科学与技术,这样正明确更完善,对手有可能是敌人或者竞争者,通信理论与技术主要涉及的是通信的有效性和可靠性、可用性、组织管理,密码学主要涉及的是数据的安全性。

  攻击者、敌手干的是什么事呢?就是破译,把你数据里面存的信息取出来。什么叫信息安全呢?来学嘉教授给信息安全一个定义,就是信息安全研究有敌手存在的信息系统,我建议对此定义也做一个修正,信息安全研究有对手存在下信息系统中的数据安全的科学与技术,如果对手不存在,它们就失去了存在的价值。

  信息安全的内涵,前面郭院士讲了这个内涵,基本上是一致的,一个是隐秘性,就是密码学里面还研究将密码隐藏起来,不被对手发现,跟保密有区别,保密是把信息存在保险柜里,没钥匙就看不到,隐藏的话呢,就是把信息存在一个复杂的信息空间中,你找不到,你不知道它在不在,有没有这样的信息,这是隐藏,也就是捉迷藏的问题。

 可控性,对秘密信息的驾驭力。

  可用性,保证授权人可以使用系统中的信息,由信息系统的物理安全性、可靠性、运行的安全可靠性和信息安全可靠性、系统的可生存性、容错性、容入侵性、可恢复性等来提供保,涉及面很广。


  密码学,密码学的话分两种,一个是抗被动攻击的密码学,就是对数据进行加密,然后让人家读不懂,攻击者在网上截获密文,然后拿回去分析。

  第二个话,就是要抗主动攻击的密码学,也就是所谓的现代的密码学,这里涉及数字签名理论与算法、多用户环境密码学等、DNA密码学等等。

  密码技术的话,包括的面很广,具体的就有很多了,我们这里就不一一的讲,比如说加密技术、签名技术、数据完整技术、密钥管理技术、网络管理技术,密码标准算法、轻量级的密码设计、密码芯片的实现技术、通用专用的密码分析硬件、抗物理攻击的密码技术、密码与水印技术的组合,还有密码与生物统计特征技术的集成等。

  信息安全技术,信息安全技术包含的内容就更多了,不胜列举,这里我们就不一一的提了,但是我们这里提信息安全技术和信息系统安全技术要加以区分,信息安全技术是研究一般的安全,保证信息安全的技术方面的东西,它可以普遍的用在各个可能的信息系统里面。

  第七个就是信息系统的安全技术,信息系统的安全技术,一个就是通信系统的安全问题,主要是解决传输的安全性,还有一个就是计算机系统的信息安全问题,就是存储和计算的安全问题,每一种都有它很丰富的内容。

  再有一个就是网络安全的问题,因为网络的话,也是作为信息系统,这个信息系统比单一的计算机系统和单一的信息传输系统要更复杂一些,特别是现代的网络,像英特网这样的网络,它是一个复杂的巨系统,有很多特殊的问题。

  还有一个信息系统中的隐蔽信道问题,还有信息系统中存活性的问题,还有信息系统的安全标准和评测技术,我要介绍的就是这么多,另外有一些参考文献,大家可以看看,谢谢大家!