大数据时代CPI调查如何发展
来源:中国信息报 更新时间:2014-08-28

        伴随着社会各界对CPI(居民消费价格指数)关注度的日益升温,互联网的高速发展,一个以信息爆炸为特征的大数据时代正在到来。这对CPI调查工作提出更多的要求和挑战,积极探索如何应对大数据时代的到来,实现CPI调查与时代接轨已成为当务之急。
CPI调查存在的问题
        一是调查对象不配合现象时有发生。价格调查中对鲜活商品等部分规格品要求“逢五逢十”采价,采价频次较高、调查范围较广,因而在与农贸市场摊主、商家等频繁接触过程中,采价遭遇“闭门羹”现象时有发生。
      二是部分采价原则较难执行彻底。从CPI实际业务工作来看,比较难以执行到位的采价原则主要有同质可比和实际成交价原则。例如,因技术更新、产品升级换代等原因,诸如手机、电脑等规格品缺价情况十分普遍,辅调员往往会面临以价格涨跌幅度合理还是以产品性能指标接近的两难选择,同质可比原则只能在把握价格趋势下宽松地执行,同时因辅调员只采不买,而服装、家具等规格品存在较大的讨价还价空间,所以想要准确取得规格品的实际成交价除非商家配合程度较高,愿意提供销售凭证,否则准确采到实际成交价存在困难。
      三是在不同采价点查找相同规格品有困难。根据方案要求对同一工业消费品及服务项目的具体规格品要选择2个调查点以上,实际中大部分规格品可满足要求,个别工业消费品比如包装食品、服装、家电等因超市、卖场等为在竞争中取得产品优势而定制不同的进货规格要求,有的规格甚至成为特供产品,这些不同经营策略给在不同采价点找到品牌、型号、性能等完全相同的规格品带来一定困难。
      四是采价点变动影响数据质量。通过对价格数据的抽查和实地采价,我们发现采价摊点不同价格存在较大差异,这种情况特别是对于鲜活商品,首先农贸市场摊点较多,其次农贸市场固定摊位和零散摊点并存,因固定摊点摊位费较高、菜品较好,进货成本较高,零散摊点菜品自产自销的居多,因而同一规格品二者间价格差异较大,而辅调员对农贸市场采价时存在采价摊点更换的情况,造成价格人为的不可比。
大数据时代CPI面临的挑战
      一是大数据对CPI采集方式产生冲击。在大数据背景下,互联网、物联网等的发展和运用,加快了信息化向社会经济各方面和居民日常生活的渗透,数据来源范围更广泛,数据采集渠道更多样化,这对CPI聘用辅调员定期价格数据采集的传统方式会产生冲击。
      二是大数据对CPI数据质量要求更严格。大数据时代,信息集中共享、信息平台公开化透明化会是必然的发展趋势,在社会公众对统计信息产品和服务的便捷式、快速查询和适时获取的同时,统计数据质量会更为敏感、更受关注、要求更高。
      三是大数据对CPI价格数据分析要求更高。大数据时代,调查队传统意义上的专业明细分工会被打破,各调查专业间的融合和交叉会是一种必然,由CPI价格变动走势衍生出的数据加工分析链条除了传统意义下与之联系紧密的生产领域PPI、IPI之外,对CPI价格数据加工分析要求更高,层次和深度更深更广。
大数据时代CPI
业务发展模式探索
      ——CPI价格数据采集方式改变。目前的CPI数据产生流程主要是借助于手持数据采集器、管理系统、汇总程序通过层层汇总上报方式生成CPI各类指数,而大数据时代面对海量的价格数据,CPI数据生产方式的数据入口则应在商家交易平台或者销售系统中加入查询、筛选、萃取、导入等一系列智能技术操作端口获取所需的规格品价格和信息,然后通过相应的数据处理加工程序生成CPI各类指数,这样一方面减少了辅调员的采价环节,避免辅调员采价过程中主动或被动的采价失误造成的数据失真,另一方面通过在平台上的查询和搜索可以迅速精准地定位不同采价点间规格品的各类信息,为代表规格品选择、规格品缺价时的正确更换、同一规格品在不同采价点的准确采价以及同质可比、众数原则、实际成交价格等采价原则的更好贯彻提供更为有利的执行环境。
——CPI调查技术手段革新。大数据背景下,一是CPI数据采集方式全面依赖于信息技术手段;二是建立CPI统计信息集中管理平台,包括对CPI数据采集、数据加工、数据汇总、数据评估、数据发布、公众查询等在内的一系列统计数据管理体系,实现与大数据的完美衔接和运用。
      ——电商等网店逐步成为CPI主体采集对象。目前淘宝、天猫、当当、京东商城、苏宁易购等众多的网络交易平台,经营的商品涉及到食品、衣着、电器、家具、建材等诸多与居民息息相关的消费品,交易金额巨大,与CPI调查的八大类商品和服务中的大多数规格品相匹配,电商等网店逐渐成为未来CPI数据采集的主渠道,当然除了大型的、全国型的交易平台以外,为了实现CPI更好地代表本地区的价格走势,还应综合地区型的网络交易平台、采价点网页数据等在线信息,例如连云港市出现的“连云港菜篮子网”网购平台,涉及到了禽蛋肉、粮油、蔬菜、水果等居民常用的农副产品,CPI食品16个大类中有六成以上代表规格品的价格信息能够在该交易平台上查询到,在充分评估其与实体店价格差异以及大众感受匹配度的前提下,可以作为本地区对部分食品类价格网络试采的探索。
      ——CPI权重调整频率加快。我国目前CPI的调整频率相对较低,按照方案制度要求,每5年才调整一次,标准主要依据全国14万户城乡居民家庭收支抽样调查资料,并辅之以典型调查数据作补充,从调整频率看明显跟不上经济发展的节奏。在大数据背景下,数据共享的功能将逐步体现,通过共享数据中心的建设,将各调查业务原本独立、分散的信息整合在一起并加以利用,实现对城乡居民家庭收支数据的共享,加快调整CPI权重成为必然,实现在每一个CPI调查自然年度适度调整权重,而CPI权重测算除了城乡居民家庭收支数据以外,还应依据贸易、服务、卫生医疗等相关部门数据资料,同时通过加强与大型超市、商场、电商等调查点的联系,获取大型超市、商场等的历史销售明细为CPI调查的小类、基本分类权重分配提供更具说服力的参考依据。
      ——CPI业务人员职能转变。大数据时代,价格数据主要是从电商交易中取得,电商的销售策略比如淘宝网的秒杀、限时抢购、节日促销等活动导致同一规格品某一采价日价格波动频繁,幅度较大,加上网店规避了实体店的人员成本、场租、水电费等常规性经营费用支出,商品价格较实体店明显偏低,这对CPI业务人员能力是极大的挑战,业务人员需要专业化的数据挖掘与分析处理能力,一是能够对交易平台、记录、系统等的海量价格数据进行准确筛选定位,并对价格数据全面把控和重点审核,二是能够把CPI数据与其他关联专业统计数据进行整合分析和加工。
      ——CPI数据发布更公开透明。一是CPI数据发布方式更完善。目前的CPI数据主要是借助于电视、网络、报纸等新闻媒体进行定期公布,大数据时代随着数据可视化、人机交互、机器智能等先进的技术的发展和应用,数据发布形式将更加多样。二是CPI数据更公开透明。由于数据的大规模存储与共享,数据信息不再是秘密,因而对于关注度较高的CPI数据应该尽可能公开原始数据、权重测算资料、编制方法、各类价格指数等数据资料,公众对CPI数据的关注和需求也由传统上的被动接受转为主动查询和获取。
      ——CPI调查服务职能提升。大数据时代CPI服务主体应该摒弃过去政府统计长期以党政机关为单一服务对象的观念,转向以满足更多社会群体,以投资者、企业经营者、个体工商户乃至农贸市场中摊主等调查对象的客观需求为导向,更好地宣传和解读CPI,在强调依法调查的同时,引导社会公众充分利用价格数据产品服务于自身的生产经营和消费活动,并主动参与到价格数据采集、分析、使用的环节中来,从而建立调查者与调查对象间的一种新型合作关系,实现真正意义上的互惠双赢。
    (作者单位:国家统计局连云港调查队)