随着大数据技术的快速发展,从政府到企业都已深刻感受到这一新兴技术带来的变革。无论从思维到应用,大数据都在逐步颠覆过去的传统。作为政府方面与数据打交道的核心机构,统计部门非常重视通过大数据思维、大数据技术,去变革传统统计工作模式。
从传统意义上讲,统计部门的工作,一方面要承担组织领导和协调全市统计工作,确保统计数据真实、准确、及时的责任;另一方面,也要为政府制定政策、建立标准,为企业及社会公众提供有效数据服务。
目前来讲,政府统计工作还存在着一些需要完善的地方。特别是在如今大数据时代,面对越来越海量的数据信息,政府统计工作如何在真实、准确、及时、全面之间寻求一种平衡,是当下统计工作需要思考的一大课题。
此外,会上也有大数据公司指出,目前政府部门在运用数据时,需要借助大数据所特有的关联关系思维的优势特征来突破固有认知,所以也需要新的思维进行突破。
在此背景下,由北京市统计局主办、《数据》杂志承办主题为“大数据技术如何助力政府统计工作”座谈会于5月22日召开。市统计局多个处室以及部分区统计局,与天眼查、国双科技、东方国信、金电联行、网智天元五家大数据企业进行面对面交流,就大数据技术未来该如何助力政府统计工作进行了深入探讨。
Q:个人认为大数据与传统统计的本质区别不是数据量的问题,而是思维导向的问题,如何利用大数据思维来提升政府统计工作目前仍是一个困惑。
东方国信:大数据技术与传统统计手段相比,能够实现的在功能上的差别就在于,大数据是以“数据+模型”的方式,全面覆盖到数据的采集、存储、计算和分析的整个流程中的,而这是传统统计手段所缺乏的,只有“数据+模型”才能全面提升统计数据的价值,为国家科学决策提供重要依据。
网智天元:大数据不仅是一项新技术,更是一种新思维。大数据技术首先带来的是对传统统计思维中因果关系的重大突破,通过关联关系的建立让数据自己去发现人类难以发现的新关联。
天眼查:大数据技术在政府管理工作中大有可为,仅就大量公开的工商数据来说,它不仅能够帮助求职群体和政府管理部门甄别企业真假,也能够进一步解决商业安全需求、响应国家构建诚信社会的需求,帮助政府工作人员在内的每一个人公平看清世界。
Q:大数据如何有效应用于经济形势的预判?
网智天元:对于宏观经济形式的预判,其核心离不开一个“金三角”模型,即:信息流、资金流、情感流。宏观经济的预测很多都不准,因为未来充满不确定性,不管你的模型做得再准确,仍然不可能把所有的变量和参数囊括进来,而这里面有个最重要的变量是情感,是人对这件事情的共识和共鸣。所有的宏观东西去预测要基于时间的维度,时间维度越长,它的不确定性就会越多,但是如果能在情感上形成共识和预判,对整个大的经济形势的发展会形成很大的作用。
国双科技:针对经济形势的预测分析,有三方面的考虑,一是数据质量问题。政府口的统计数据是结构化数据,基于这种历史数据去建模,去判断未来趋势,理论上可行,从这个角度主要看数据量是否全面。二是建模问题。政府统计部门的数据模型需要靠统计专家、经济专家以及建模专家共同去搭建,这三者缺一不可。三是影响经济发展形势最重要的因素之一是社会心理因素,要把不同经济环境下的社会心理因素考虑进去来做建模,才能最大程度保证其预判的有效性。
Q:如何降低预测中的不确定性?
网智天元:群体共识是事物发展趋势中很重要的一个影响因素。一般来讲,预测可以做,但是预测无法消除不确定性,因为客观条件、世界各种环境在不断变化,当本来的因果关系变成关联关系,本来的关联关系变成因果关系,历史数据就不太有参照意义,这时候预测可能会出现黑天鹅。但群体的共识和共鸣能帮我们降低预测中的不确定性。借用《易经》里的话说,“君子知微知彰,知柔知刚,万夫之望。”,知微是微观、知彰是宏观,知柔是情感、知刚是金融,万夫之望就是万众一心的共识。所有宏观的东西一旦形成共识和共鸣后,就可以把好的不确定性升高,把坏的不确定降低,这时预测就相对比较准确。
Q:非结构化数据的数据标准问题怎么解决?
国双科技:在大数据领域,我们讲统一数据标准,十几年前,国双在制定企业内部数据的时候,就做了一本数据字典,最后形成了一个企业内部的规范,非常厚。而这本数据字典的数据颗粒度非常细,所以内容很多。第一点是数据标准很重要,再往下扩展,就涉及到数据接口。因为我们的平台会很多,我们会介入的部门也会很多,所以数据接口的统一非常重要。
东方国信:不同软件供应商给政府建设的信息化系统标准不一致,数据类型也不一致,导致数据质量不高,所以对数据的全面治理是非常必要的,这也是实现数据标准化建设的必要条件。
Q:怎么实现统计的智能化?
国双科技:如果从统计的角度来讲,怎么让统计往智能化方向发展,这些应用场景至少有一个智能平台,这个平台既能满足传统统计方式,又能容纳新的方式,这个平台在政府内部需要打通各个部门数据,这个大数据平台不同数据源都能接进来。
金电联行:关于大数据技术而言,与传统统计相比,一般在数据质量、数据评估过程中通常会有完整的流程体系,有一定标准,在政府已有平台的基础上,应用这些标准,包括技术、经验等,都可以直接运用到层层模块中。比如说建立一下小的辅助决策模块,或者将经验规则、引擎算法直接引入系统,打造平台+技术的新型模式。
Q:如何利用大数据去判断一个新业态的发展?
说,刚冒头的时候它能留下的痕迹是非常少的,政府如何在一个新产业冒头时就能发现它,这就是一个从哪里去获取有效数据的难题了。
那么除了比较普及的一些招聘数据,金电联行会通过支付数据等一些比招聘信息更前置的数据信息来预判一个新业态的发展苗头。比如说某个行业还没有在市场上发展起来的时候,这个行业的大牛们会在一些专业的网站论坛等发布这些信息,如果这些信息的量逐渐提升,这个新业态就很有可能马上就要发展起来,再和招聘数据去做印证,这个时候会得出一些更准确的结论。
此外,在信用体系方面,我们建设得比较好的参与双公示的一些企业信息,包括资质证的发放情况这些信息,也能反过来体现我们一些强势的行业,或者是正在逐渐发展的行业,它能不能更稳定地走下去,这是我们在实际项目得出来的一些经验。
文 / 李婷
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报 违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1 京公网安备11010502045556号 互联网新闻信息服务许可证11120220001号