大数据时代的国家创新系统构建问题研究
来源:中国科技论坛杂志 更新时间:2014-04-02

当前,一个大规模生产、分享和应用数据的时代已经开启。庞大的人群和应用市场,复杂性高、充满变化,使中国成为世界上最复杂的大数据国家。从国家层面看待大数据问题,制定引导大数据研究和大数据应用的相关政策,构建大数据背景下的国家创新系统,是增强国家核心竞争力的重要保障。本文从大数据引发的思维变革、商业变革和管理变革三个方面入手,分析大数据将会对我国社会产生的深远影响,为大数据时代国家创新系统的构建提供理论支持和政策建议。
    2007年,诺贝尔奖获得者吉姆·格雷指出,数据密集型科学正在从计算科学中分离出来,成为科学研究的第四范式。像经典力学、量子力学和计算科学一样,数据密集型科学必将影响到社会科学研究方式。科研范式的转变最终会反馈到人们思维模式和决策模式的转变。吉姆·格雷的这一论断准确预言了大数据时代的到来。

  大数据(Big Data),或称大规模数据、海量数据,其所涉及的资料规模巨大到无法通过目前主流软件工具,在合理时间内提取、处理并整理成为决策信息。美国国家科学基金会(NSF)将大数据定义为“由科学仪器、传感设备、互联网交易、电子邮件、音频视频软件、网络点击流等多种数据源生成的大规模、多元化、复杂、长期的分布式数据集。大数据的特点可以归纳为4 V:海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Vafiety)和巨大的数据价值(Value)。通过无处不在的计算和传感器,大数据能够解析存在于现实世界、虚拟世界以及虚实融合世界的复杂网络关系,并适时做出判断和决策。这种决策模式遵循数据转变为信息、信息转变为知识、知识涌现出智慧的流程。大数据所具有的在区域之间、行业之间和企业部门之间的穿透性,正在颠覆传统的、线性的、自上而下的目标驱动的精英决策模式,形成面向不确定性的、非线性的、自下而上的发现群体智慧的数据驱动决策模式。维克托·迈尔.舍恩伯格和肯尼思·库克耶在《大数据时代:生活、工作与思维的大变革》一书中提出了相关关系的大数据思维,即人们可以驾驭所有数据,而不是仅仅抽取小样本;人们可以挖掘更具混杂性的数据,而不用苛求数据的精准性;人们只需知道“是什么”的相关关系,而不需深究“为什么”的因果关系。

  当前,一个大规模生产、分享和应用数据的时代已经开启。庞大的人群和应用市场,复杂性高、充满变化,使中国成为世界上最复杂的大数据国家。解决这种由大规模数据引发的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。就像望远镜让我们感受宇宙,显微镜让我们能观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正在蓄势待发。从国家层面看待大数据问题,制定能引导大数据研究和大数据应用的相关政策,构建大数据背景下的国家创新系统,是增强国家竞争力的重要保障。本文从大数据引发的思维变革、商业变革和管理变革三个方面入手,分析大数据将会对我国社会产生的深远影响,为大数据时代国家创新系统的构建提供理论支持和政策建议。

  1.大数据时代的变革

  1.1 大数据时代的思维变革

  大数据与三个重大的思维转变有关:首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本;其次,我们乐于接受数据的纷繁复杂,而不再追求精确性;最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。很长一段时间以来,准确分析大量数据对我们而言是一种挑战。为了让分析变得简单,我们会把数据缩减到最少,加上统计学的采样分析,可以得出能够帮助我们决策的结论。小数据时代,样本选择的随机性比样本数量更重要,采样分析的精确性随着采样随机性的增加而大幅提高。但是,采样分析的成功依赖于采样的绝对随机性,而实现随机性是非常困难的。一旦采样过程中存在任何偏见,分析结果就会相差很大。另外,当人们想了解更深层次的细分领域时,随机采样的方法就不可取了。大数据是指不用随机分析法这样的捷径,而采用所有数据的方法分析问题。

  在越来越多的情况下,使用所有可获取的数据变得更为可能,但为此也要付出一定的代价,那就是数据中的错误信息。大数据时代要求我们重新审视精确性的优劣,大数据不仅让我们不再期待精确性,也让我们无法实现精确性。确切地说,在很多社会和技术领域,我们更倾向于纷繁混杂。大数据要求我们有所改变,我们必须能够接受混乱和不确定性,通过接受不精确性,我们开启了一个从未涉足的世界。大数据的核心是预测,通过找到一个关联物并监控它,我们就能预测未来。

  1.2 大数据时代的商业变革

  大数据成为许多公司竞争力的来源,从而使整个行业结构都改变了。大公司和小公司最有可能成为赢家,而大多数中等规模的公司无法在行业调整中受益。掌握着大量数据的大公司通过分析收集到的数据,成功实现了商业模式的转型。苹果公司进军移动手机行业是个很好的例子,它在与运营商签订的合约中规定运营商要提供给它大部分的有用数据。通过来自多个运营商提供的大量数据,苹果公司得到的用户体验的数据比任何一个运营商都多。苹果公司的规模收益体现在了数据上,而不是固有资产上。大数据也为小公司带来了机遇,聪明而灵活的小公司能享受到非固定资产规模带来的好处。重要的是,因为最好的大数据服务都是以创新思维为基础的,所以它们不一定需要大量的原始资本投入。

  1.3 大数据时代的管理变革

  我们在生产和信息交流方式上的变革必然会引起自我管理所用规范的变革。这种变革不仅仅止于规范,在更深层次上也体现了价值观的转变。在大数据时代,我们需要建立一个不一样的隐私保护模式,这个模式应该更着重于数据使用者为其行为承担责任,而不是将重心放在收集数据之初取得个人同意上。将责任从民众转移到数据使用者很有意义,也存在充分的理由,因为数据使用者比任何人都明白想要如何利用数据,所以他们理所当然应对自己的行为负责。

  总之,正是因为有了思维的革命,才有了推动现代社会发展的商业变革和管理变革,而无论是商业变革还是管理变革,都离不开创新活动。

    2.大数据时代的创新问题

  数据之于信息社会就如燃料之于工业革命,是人们创新的力量源泉。没有大量鲜活的数据和健全的服务市场,很多创新就无法实现。

  2.1 对创新的研究

  最早研究创新理论的一定是经济学家。这是因为当我们探讨经济为什么增长这一命题是,我们就不可能回避创新问题。在《经济增长的秘密》一书的第四章,赫尔普曼谈到了创新问题,即技术对经济增长的影响。1996年,经济合作与发展组织(OCED)发表了具有划时代意义的重要文献《知识经济》。这一文献将以前讨论的技术创新归纳为更为宽泛的知识创新,并认为经济合作与发展组织成员国已进入了一个崭新的以知识与信息为核心的时代。这一文献还完整描述了一个国家的科学系统,即知识运动系统是如何完成知识生产、知识传播和知识应用三大职能的。

  除了经济学家对创新的研究,管理学者也进行了大量的探索。1990年,亨德森和克拉克把创新分成四种类型:渐进式创新、模组创新、建构创新和激进式创新。1993年,德鲁克教授在其经典著作《创新与企业家精神》中出,创新是组织的一项基本功能,是管理者的一项重要职责,它是有规律可循的实务工作。德鲁克把创新分为三类:1)产品的创新一即产品或服务的创新;2)管理的创新一即制造产品与服务,并且将它们推出上市所需要的各种技能与活动的创新;3)社会的创新一即市场、消费者行为和价值的创新。

  从经济增长理论对创新的研究可以看出,大规模的创新取决于一个国家的整体经济环境。鉴于这一认识,从20世纪80年代开始,一些学者开始把注意力集中到创新型国家的研究上来。在《国家竞争优势》一书中,迈克尔·波特教授从国家竞争力的角度把一国的经济发展划分为四个阶段:生产要素导向阶段、投资导向阶段(Invest -ment-driven)阶段、创新导向阶段和富裕导向阶段。波特认为,几乎所有发展中国家正处于生产要素导向阶段。在投资导向阶段,居民储蓄开始增加,企业和政府的投资意愿大大加强,开始引进技术并模仿,也开始具有改良外国技术的能力。当一个国家跨入创新导向阶段时,其经济特征表现为个人收入提高,高等教育普及,对便利性的需求增强,消费者需要更为讲究,从而导致企业在产品、流程、技术、市场营销等方面接近精致化程度。企业开始大规模对外投资,产业集群开始出现世界级的支柱性产业和大型跨国集团,具有竞争力的新产业不断产生,其服务业也开始走向国际化。第四阶段是富裕导向阶段,与前三个阶段不同的是,这一阶段的本质区别是经济开始步入衰退。原因是这一阶段的国家目标重心放在了社会价值上,忽略了经济持续进步的基础。

  2.2 大数据对创新的影响

  综观我国的经济发展状况及发展走势,我国目前正处于投资导向阶段,正在向创新导向阶段过渡。我国目前正积极调整产业结构,推崇内生型经济增长模式,加大自主创新的推动力度。在大数据时代,无论是经济学家的有关经济增长的创新研究,还是管理学者的对创新内容和创新形式的论述,无疑都有助于企业获得新的增长方式,找到新的利润增长点。

  我们在理解和解释世界上各种现象时,使用两种基本方法:一种是通过快速、虚幻的因果关系,还有一种是通过缓慢、有条不紊的因果关系。

  小数据时代,人们偏向用因果联系来看待周围的一切,即使这种关系并不存在。大数据时代,通过去探求“是什么”而不是“为什么”,相关关系帮助我们更好地了解了这个世界。例如,2009年,互联网巨头谷歌公司用相关关系分析法准确判断出了甲型H1N1流感是从哪里传播出来的,路径是什么,这一预测与官方数据的相关性高达97%。大数据时代的创新,在强调因果关系的同时,必须关注相关关系,甚至有时候不需要知道因果关系。传统观念认为,完美的管理能够造就伟大的企业。1997年,哈佛商学院教授克里斯滕森在其《创新者的窘境》一书中,提出了破坏性创新的概念。面对新技术和新市场,往往导致失败的恰好是完美无瑕的管理。2003年,在其后续力作《创新者的解答》一书中,克里斯滕森指出,成长的关键,在于成为破坏者,而不是被破坏者。大数据时代,创新方式正在被云计算、移动互联和大数据所改写,因此,创新机制的构建、知识生产、知识传播和知识应用也需要与时偕行。

  3.大数据时代国家创新系统的构建

  进入21世纪以来,世界经济逐步朝向知识经济发展,创新导向阶段已经成了我们必须跨入的经济发展阶段。党的十八大报告提出:“要坚持走中国特色自主创新道路,以全球视野谋划和推动创新,提高原始创新、集成创新和引进消化吸收再创新能力,更加注重协同创新”。这些“创新”的提出对知识创新提出了更高的要求,构建大数据时代的国家创新系统已迫在眉睫。那么,我们该如何定义国家创新系统,进而构建这一系统呢?国家创新系统包括企业、科研机构、高等院校、政府部门、中介机构和基础设施等,国家创新系统是第二次现代化的发动机H引。国家创新系统结构如图1所示。在国家创新系统中,研究与发展活动既是知识和技术的源泉,也是联系知识生产、传播和应用的纽带。

  

图1 国家创新系统结构示意图

  国家创新系统有6个基本要素,即创新活动的行为主体、行为主体的内部运行机制、行为主体之间的联系、创新政策、市场环境和国际联系。①创新活动的行为主体,主要是企业、研究机构、教育培训机构、政府部门等。企业是创新投入、产出及其收益的主干,因而在国家创新系统的起着关键作用。②行为主体的内部运行机制,决定国家创新系统运行效率的重要因素。系统由构成系统的要素及各要素间的相互关系所组成,各要素的自身优化是系统整体实力和效率的基础。③行为主体间有效的联系和合作,创新资源在行为主体间高效的流动,有助于分担创新风险、减少创新成本、加快创新速度、提高创新效益,各行为主体之间的密切联系有助于国家创新系统的整体效率。④创新政策,指能对创新活动产生影响的法律、法规和政策。通常分为供给、需求和环境等几大方面的政策。创新政策与国家的科技政策、经济政策、产业政策、财政政策、税收政策、教育政策等有密切的关系。⑤市场环境是企业创新活动的基本背景。市场作为一种资源配置的方式,对企业及其他行为主体的创新活动具有重要影响。⑥国际联系是每个国家的国家创新系统与国际大环境进行资源交流的重要环节,也是每个国家创新活动的行为主体进行国际竞争与合作的途径和方式。

  综上所述,在大数据时代,国家创新系统的建设应更具有前瞻性、指导下和操作性,结合我国的经济发展现状和世界经济走势,本文建议我国的国家创新系统包括技术创新系统、知识创新系统、知识集成系统、知识传播系统和知识应用系统组成。其中,技术创新系统是国家创新系统的基础。知识集成系统的引入,是国家层面引导创新、推动创新、促进创新成果传播的关键环节。

  技术创新系统基于企业经营和管理实践,学习、引进、开发大数据处理技术,为国家知识创新系统提供详实的应用案例。2012年3月19日,美国总统奥巴马宣布启动“大数据研究与开发计划(Big Data Research and Development Initiative)”,旨在提高从大型复杂数字数据中抽取知识与观点的能力,以帮助解决国家在科学与工程中最紧迫的诸多挑战和问题,增强国家安全,实现教育与学习的转变。美国这一研究计划为我国国家创新系统的建设,尤其是技术创新系统的建设提供有效的思路和解决方案,即转变决策驱动根源,由传统的“目标驱动决策”向“据驱动决策”转化。参照美国政府大数据研究与开发计划的新思路,整合技术创新现有的理论和方法,充分考虑大数据环境带来的机遇和挑战,我们提出大数据时代的技术创新系统双向决策模型,即目标驱动模式和数据驱动模式并行的双向决策模型(见图2)。一方面,以传统目标驱动为基础,形成以传统数据挖掘技术、支持决策的技术评估与预测模型。另一方面,围绕大数据环境下的复杂数据特征与环境,采用当前数据挖掘领域应用于大数据处理的新方法、新思路,形成以自组织动态实时监测为核心,能有效预警并积极处理突发事件的技术监测与预警模型。通过这一双向决策模型,技术创新系统能够为知识创新系统的建立提供了技术路线和大数据应用案例。

 

图2 大数据时代的技术创新系统双向决策模型

  知识创新系统在学习、引进国外大数据相关理论和案例的基础上,强化知识提取和加工能力,认真研究我国海量数据企业(如互联网、电子商务、通信、银行、证券、保险、旅游、快速消费品等)的实践,从中提炼适合我国国情的大数据知识,系统总结大数据创新方法,为知识集成系统提供必要的信息。知识集成系统负责各地区、各产业大数据技术应用案例的汇总以及有关大数据技术的新知识整合。在这一环节,国家信息主管部门、国家创新管理部门、国家统计部门以及各行业协会需要通力合作,在这些机构间建立信息共享机制。其中,国家创新管理部门对知识的广泛传播起着至关重要的作用。知识传播系统积极传播大数据技术和知识,培养能够大数据驾驭大数据应用技术的人才。知识应用系统利用消化吸收和自主创新的大数据知识成果,开展经营和管理实践。各子系统的主要功能见表1。

表1 两组技术群体选择不同策略的适应性
 

  4.构建大数据时代国家创新系统的建议

  4.1 制定政策鼓励大数据企业及科研机构的自主创新活动

  国家的科技政策、经济政策、产业政策、财政政策、税收政策、教育政策等对创新有着很大的影响,这些政策对创新活动起着导向和促进作用。党的十七大,国家提出了建设创新型国家的国家战略,党的十八大更是明确指出,我们要坚持走中国特色自主创新道路。自主创新,就是要打造一大批具有独立知识产权的产品和技术装备。自主创新是我国可持续发展的重要保障。因此,必须从国家政策方面引导大数据企业以及相关联的科研机构的自主创新活动。

  4.2 保护大数据市场

  随着大数据的应用价值越来越被人们重视,政府应该高度关注大数据产业的发展,制定相关政策以保护大数据市场。为了促进大数据的应用,可以实现数据交易,鼓励大数据技术开发的创业行为,在政策上予以扶持,如扩大国家创业投资引导基金的使用范围。但是,我们必须防止21世纪数据大亨的崛起,借鉴美国当年应对铁路垄断、钢铁生产垄断和电报电话垄断的反垄断法,为大数据产业的发展,从法律意义上提供必要的支持。

  4.3 保护个人隐私权

  在大数据时代,我们应该建立一个隐私保护模式,这个模式应该更着重于数据使用者为其行为承担责任,而不是将重心放在收集数据之处的个人许可、匿名化上面。这样一来,使用数据的公司就需要基于对个人造成的影响、对涉及个人数据再利用的行为进行正规评估。另外,政府必须平衡数据二次利用的价值与个人信息过渡披露所带来的风险。监管机构可以决定不同种类的个人数据必须删除的时间。

  4.4 加强国家信息安全管理

  数据是信息时代的“石油”,为了国家的核心竞争力很大程度上依赖于将数据转化为信息和知识的速度与能力,实际上取决于大数据技术的开发和应用能力。同时,信息的开放性和数据的流动性使我们不得不考虑国家的网络信息安全问题,如果我们不加以控制,我国会面临巨大的战略性风险。美国一向非常重视国家信息安全,可以形象地说成“常忧患、起得早、协调好、干得快、不动摇”。这为我国信息安全建设提供了很好的借鉴。我们未来的网络信息安全战略,在加快解决传统信息安全中的短板问题的同时,需更加重视面向未来的信息技术和产业层面的创新行动,必须在未来国家信息安全战略中高度重视大数据问题,并着力尽快凝聚各方共识,迅速行动,加大投入,早日使我国成为大数据强国。