您的位置: 首页 > 数据杂志

众议数据治理

出处: 作者: 网编:胡立群 2018-11-15

在经过几年时间的发展,大数据已经逐渐渗透到农、工、商以及政府机构等各个领域,并逐渐为传统行业探讨出新的发展机制。然而曙光在前,却仍待破晓。

大数据行业里数据隐私泄露、数据割据、数据造假、数据黑产交易等各种乱象丛生,自5月底欧盟一般数据保护条例正式生效以来,国内对于数据治理呼声愈烈,希望能够对数据确权、标准制定,以及相应法律法规的出台尽早落实,为数据共享互通创造安全的环境,确保大数据在安全的前提下自由连接从而激发其巨大价值。

数据治理需要标准+规范

李德强 北京市大兴区统计局局长

微信截图_20181011164642.png

目前,绝大多数数据仍以各种形式零散地存在于政府部门、电商企业、电信运营商和互联网公司等数据持有者手中。数据标准不统一,指标口径杂乱,数据格式也不一致,有CSV格式的,有DBF格式的,还有文本格式等,数据之间难以整合和衔接,从而限制了大数据的应用和共享。

因此,迫切需要有关部门制定标准和规范这些大数据。统计局恰恰有这方面的优势,所以统计局应尽快出台这方面的规范,对发布频率、存储格式、发布范围、指标解释等加以规范,以便这些数据能够整合应用,发挥最大作用。

另一方面,规范制定以后,还要通过修改《统计法》、《统计法实施条例》等法律法规,加以规范和约束。统计局是各种大数据的管理部门,大数据的所有者应无偿向统计部门提供。通过执法检查,对那些不执行规范的单位,进行依法处理。

相应的,统计部门的工作重点也应该由“组织调查干统计”转变为“依法行政管统计”,不断以自身的机制创新和模式创新适应大数据时代对政府统计工作提出的新要求。

数据治理的目标是动态数据安全

王志海 明朝万达董事长

微信截图_20181011164652.png

数据治理需要弄清楚的一个核心是:数据所有者可以规定谁在什么地方、什么地点、什么时候,能有什么权限去使用这个数据。数据安全本质上解决的是数据的所有权问题,而实现数据治理,必须站在大数据的角度,把流程再造,并确保其过程中数据的安全。

从实际经验来看,对于如银行等部分信息化建设相对成熟的行业客户来说,其需求已逐步从数据安全上升为数据治理,那么对于这一问题的解决仅仅着眼于安全本身是不够的,因为脱离大数据实际应用场景谈数据安全过于以偏概全,必须从数据全生命周期的管控、治理出发,来重构全面的数据安全体系,才能帮助用户真正解决问题。以此为契机,包括数据流程梳理、数据分类分级、数据权限设计以及数据安全防护技术在内的相关数据治理体系才能日渐受到重视。

再者,数据治理一定要与充分发挥数据价值紧密结合,虽然数据安全防护的技术核心就是数据的加密和权限管理,但它需要实现的目标是保证大数据流动全周期内的动态数据安全。数据只有流动才能产生价值,但数据流动的前提是要消除流动带来的安全隐患,这两者间的矛盾单靠技术无法解决,需要一个更大的机制去创造一个安全共享的环境。而明朝万达想要做的,就是以数据安全为基础,以行业为依托,激活大数据本身的价值,帮助用户建立其大数据生产平台,再通过大数据服务于客户,真正将数据治理这一概念落地。

数据治理的根本是要平衡三个矛盾

赵国栋 中关村大数据产业联盟秘书长

微信截图_20181011164704.png

数据治理从行业角度来看,更关注的是数据在不同利益主体之间平衡的问题。这个主体利益可能是大型集团、大的行业,他们和其他行业之间数据共享、数据交换存在怎样的数据机制。

所以要解决这些问题可能最根本的是要平衡三个矛盾:一是国家数据主权跟数据割据之间的矛盾;第二,它要平衡数据开放跟个人隐私保护之间的矛盾;第三,它要平衡大型企业发展和中小企业合法权益之间的矛盾。那么从行业出发同样也需要一套治理机制,甚至需要互联互通的协议,这是相辅相成的,我们当下发布的“数联网”,正是为了要解决这些问题。

数据治理的一个核心问题是“数据确权”。以个人隐私数据举例来说,我是觉得个人隐私数据就像是人的脚印,脚印留在了不同的地方,那么留在不同地方的脚印到底属于谁?这个至今没有明确答案。公安部门通过技术手段把你的脚印拿走了,破案用了,动用了很多人力、物力,那么这应该是属于破案用途的资产。但在互联网上就发生一个变化,你的脚印随处可见,带来灰色产业链的成本急剧降低,随便什么人都能拿你的脚印做一个事情,没有定义、没有标准、没有规范,就没有所谓的可为和不可为,那这个时候就会产生包括个人隐私数据安全问题,这个问题也是数联网试图在解决的问题,数联网的目标是,在满足网络实名制要求的同时,杜绝网站存储个人的隐私数据。

数据治理要重点解决数据关联难题

崔晓波 TalkingData创始人兼首席执行官

微信截图_20181011164716.png

数据治理是非常大的概念。从数据治理角度来看,企业内部分三个方面:第一是制度,数据使用需要有整个内控的标准,包括内部对数据加工处理比较体系化的流程,这是目前在企业里面强调比较多的;第二,从数据本身来看,数据的种类、标准化、定义在各个标准化组织里面谈得比较多;第三,企业这么多异构数据源,技术角度来说要解决它的互联互通以及安全保护的问题,这是我们从企业视角是这样。而现在在《网安法》里面最复杂的,是它没有界定,两个数据源在没有客户明确的授权之下能不能做关联?这也是我们整个数据领域应用的过程中最核心问题。

法律里面都是有定义的。比如说在美国法律专有名词意为伪命名化、半命名化,允许两个数据源在没有客户授权的情况下可以做关联,但是它强调的是做出关联之后的那个动作,如果之后的行为涉及侵权就是违法行为,如果关联之后的行为是正当的,那么法律是不敢干涉的。但欧盟的法律是没有得到个体授权绝对不能做数据关联,这是两个区域的法律完全不同,而中国是完全没有定义,所以数据治理要重点解决这一问题。此外,目前行业内的一些基础性问题没有得到解决,一是每个行业的数据分类没有一个统一的标准,二是数据的边界不清晰,例如隐私数据和非隐私数据之间的边界,再者从商业的角度来看,哪些数据是基础性的应该免费使用的,哪些数据又是有很高的商业利益应该有偿使用的?这个边界也需要分清楚。所以当前对于数据治理,我们需要满足这几个条件,第一把数据的分类定清楚,第二把数据的边界定清楚,第三国家部委要给一些更实际的落地建议。

数据治理需回归场景应用

莫倩 网智天元首席战略官

微信截图_20181011164731.png

数据造假产生的核心原因在于商业社会中信息流、资金流、情感流所构成的三角关系,信息流与资金流最终是要创造情感价值,而情感需要衡量和度量,如果无法量化,那么就无法管理和控制。数据正是衡量情感流的信息化体现,并且情感流价值直接关系到利益的获取,所以资金流能够干预数据信息而表现出虚假的情感流价值,于是造成数据造假事件频出。其实对于治理数据造假来说,数据本身就是技术工具。因为数据造假只能是片面的,无法全面造假。所以无论是真实数据还是虚假数据,都能通过大数据的全量监测分析找到其中的关联和规律,从而加以管理。

总体来说,数据治理应当从三个层面入手,第一是制定标准,第二是分享利益,第三是尽快建立相应的法律法规。在统一标准的前提下,通过利益驱动的引领作用,实行相应的惩罚机制来兜底。从另一个层面来说,虽然数据能够从技术层面解决数据乱象问题,但是从人性上无法解决,在解决途径中依旧会遇到阻碍。究竟如何治理数据造假的问题,莫倩的观点是,不能仅就数据谈数据治理,数据治理最终都要回归到对现实问题的治理上去,数据治理本质上不应该是对数据的治理,而是运用数据对现实问题进行治理,只有真正下沉到具体的应用场景中去,数据治理才有支撑和可行性。

数据治理需国家、企业、个人三方努力

张浩 饿了么副总裁

微信截图_20181011164742.png

数据应用实际上是一个匹配的过程,如何让数据信息更完整更准确、更及时地反馈出真实世界,包括人、物、场,是所有大数据应用都面临的问题。同样的,数据治理是所有互联网公司乃至传统产业未来都要面临的问题。

如果平台真有大数据杀熟,其实最终伤害的是消费者对平台的信任,信任直接影响着平台商家的生意。通常出现同位置同餐厅不同价的情况,原因是手机定位不同导致的配送费差异,这种问题可以通过技术手段解决,提高手机室内定位精度。

关于数据隐私泄露,一旦发生就会带来非常严重的危害,这就好比银行被抢钱了一样。保护用户隐私安全的问题,是国家、企业、个人三方都在共同重视努力的方向。

阿里巴巴集团在数据安全保护方面的积累和经验,对刚加入阿里巴巴的饿了么来说,将会是很好的加持。目前,饿了么正在依据阿里巴巴的数据安全管理办法,对数据进行重新梳理和分类。

从全行业以及国家角度来说,信息安全已经引起了非常大的重视,不过目前法律构建方面还很不完善。2017年,我国出台了《中华人民共和国网络安全法》,其中对个人信息保护做了明确规定。“任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。”

数据共享的是数据价值

李海涛 光猪圈健身CIO

微信截图_20181011164752.png

所谓“大数据”有三个要素,一是数量大,二是种类多,三是有价值。光猪圈健身所处健身行业,整个行业都存在的问题是数据的量、种类不足,数据价值能做什么处于探索阶段。

比如当健身者进入自由力量训练,目前就还没有足够成熟的技术加以数据采集。另外单一设备所能采集到的数据种类也有待进一步丰富,比如我们的跑步机已经实现了有氧里程、时长、消耗卡路里、配速等数据的采集,诸如步频、步幅等更加精细的数据还没有。

数据共享应该共享的是数据价值,而不应该共享原始数据,或者未脱敏数据。在数据应用上,对用户的隐私保护不够,会导致用户抵触使用产品。数据造假无法获得真实的数据价值,也有商业欺诈嫌疑。而数据杀熟是一个商业营销手段,虽然体现了商业的逐利本性,但也是数据价值的实践体现。

为了促进行业规范化发展,首先建议行业数据隐私保护等级备案制度及审计制度,防止不良企业恶性泄露数据隐私;在数据共享方面,建议制定大数据行业数据共享标准,防止未脱敏数据共享;与此同时,在保证数据准确性方面,可以通过使用区块链技术确保数据的真实性,防止数据被篡改及造假。

从企业角度来说,可以建立行业自律委员会,提升企业自律意识,通过行业组织指导数据价值的正确使用,确保类似大数据杀熟的商业手段不被滥用。

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号