当教育遇上大数据
来源:中国教育网 更新时间:2014-06-11

   作为与数据最为相关的领域之一,继互联网、物联网之后,教育被视作大数据大有可为的重要行业。遍布教、学、研多层面的数据集合,通过有效利用大数据技术,可帮助学生改善学习效率,提供符合职业规划的个性化学习服务,同时也有助于教育和科研机构加快提升科研成果和教育质量,培养更多更优秀的创新性人才。

  大数据时代教育迎新机遇

  大数据时代,教育模式将加速转型,一方面传统教育在朝着数字化教学过渡期间,也将逐步引入大数据分析技术,更好地满足人才培养、教育科研的需要;另一方面,不同区域社会经济发展带来的教育差异性,可通过数据挖掘、教学案例结合本地产学结构,实现教育的“智慧化”。但无论何种情况,教育中的数据挖掘将成为大数据分析的首要内容。

  教育机构长年积累的数据大部分为结构化数据,比如考试成绩、出勤纪录等,但近几年兴起的数字化学习、教学互动等新型教学形式,通过智力辅导系统、个性化学习系统等产生的非结构化数据,为大数据时代教育行业的数据挖掘与分析奠定了基础。

  华为引领中国教育大数据应用

  就目前来说,教育行业通常采用的数据价值分析包括有预测、聚类、相关性挖掘、判断、模式发现,通过这些技术可利用大数据全面提升教育质量和信息化水平。

  在中国,教育行业的大数据市场更为广阔,中国拥有较大的人口基数,同时随着社会经济的发展,人们对教育的重视和投入也逐年加大。比如中国顶级高等教育学府清华大学,承担起国家下一代互联网核心网国家工程实验室建设项目中的“下一代互联网核心网运行管理技术研发平台测量系统”的建设内容,并建成“综合流量采集与分析系统”和“Netflow流采集与分析系统”。前者需存储6小时长度的全报文和24小时的分组头数据,最大满足540TB;后者需支持25个核心节点的Netflow流数据的采集。采集系统、存储系统、分析系统还需分层独立构建,并能够满足未来存储容量和分析平台升级的要求。

  考虑到整体架构的复杂性和平台项目的长期性,需要选用具备整体解决方案的大数据技术。最终,清华大学选择了华为的计算和存储等一揽子解决方案:

  1、通过N8500集群NAS系统为Netflow流采集与分析系统提供CIFS/FTP业务,保存Netflow文件数据,实现25个POP站点流数据及清华站点流数据的集中存储与共享;

  2、采用40台RH2288H机架服务器为综合流量采集与分析提供存储和分析平台,并为后续Hadoop平台的建立奠定基础。

  华为高性能RH2288H服务器,通过创新架构和高效设计,实现I/O模块化灵活配置和热插拔,在满足高可靠性、高可用的同时,可确保最优的计算性能和扩展能力,为后续的Hadoop大数据平台的部署和应用提供广阔空间。除了支撑改平台的RH2288H服务器以外,华为业内首创推出的深度融合刀片服务器E9000,集计算、存储、交换、管理于一体,可大幅简化机房部署、提升运维效率。通过业内领先的计算、存储密度和能效,还可实现IT成本的显著节省。

  红花还需绿叶衬大数据技术先行

  清华大学承担的国家工程试验平台,其目的就是为了针对下一代互联网的发展需求,建立核心网技术研发、测试和试验平台,开展关键技术以及运营管理技术研究,推动下一代互联网技术试验、应用示范和产品开发,提高我国下一代互联网核心网的运行和管理技术水平。实验室建设将紧密围绕信息化发展需要,提高下一代互联网领域的自主创新能力,完成国家有关部门委托的科研课题,开展相关产业关键技术攻关、重要技术标准研究制订,凝聚、培养产业急需的技术创新人才。

  从某种程度上来说,教育大数据的应用需要长远规划,并通过早期试点形成规模效益。在助力清华大学国家工程试验平台项目上,华为深厚的技术底蕴和卓越的产品与解决方案,帮助实现了25个POP站点及清华站点流数据的集中存储和共享,并为分光数据采集系统提供存储和分析平台,有利于后续Hadoop大数据平台的设立和应用。