文/陈根
“大数据”的产生与应用推动了世界范围内科学技术领域空前的创新,驱动着商业模式和管理理念历史性的变革。数据资源日益成为人类社会重要的生产要素和战略资产,采集、分析、应用数据的能力也迅速成为国际竞争的焦点。
数据资源的价值体现离不开数据的开放与流通,在这样的背景下,第三方数据交易平台应运而生,对接了数据市场的需求。
早在2014年,全国首个大数据交易平台——中关村数海大数据交易平台就在中关村成立。其后,全国范围内,贵阳大数据交易所、上海数据交易中心、重庆大数据交易平台、北部湾大数据交易中心等数十个交易平台随之建立、发展。
近日,《北京市促进数字经济创新发展行动纲要(2020-2022年)》、《北京市关于打造数字贸易试验区的实施方案》、《北京国际大数据交易所设立工作实施方案》相继发布,这是国家加快推进大数据交易基础设施建设的一个标志,也是大数据交易所融入市场的再进一步。
为什么需要大数据交易所?
大数据交易所的必要性还要从大数据交易的痼疾开始说起。
继云计算、物联网之后,也就是人与万物都智能化、数据化之后,大数据广泛巨大的应用潜能和一片向好的市场前景催生了新型商业模式,也驱动了大数据价值产业链的形成。
大数据的价值逐渐为社会所认知,数据科学决策成为政府、企业的共识,数据开放共享的迫切需要与日俱增。但是,随之而来的却是大数据交易的困境。
一方面,从电信、金融、医疗等跨域部门,到制造、教育等传统企业,再到电子商务、社交平台等新兴媒体,中国潜在的大数据资源非常丰富且覆盖广泛。但即便在大数据的存储和挖掘方面有了突破,却依然存在大量的“数据孤岛”。这主要是由于各方出自利益的考量,没有使得丰富的大数据汇聚为一片蓝海。这些大数据以碎片割裂的方式分散在不同的地方,才形成了“数据孤岛”的窘境。
事实上,数据流通并非新生事物,但由于大数据交易市场的交易规则缺失、定价标准不确定、交易双方信息不对称,造成交易成本很高而且数据质量也无法得到保障的现象,这极大地制约了数据资产的流动。
其进一步的影响,就是互联网巨头、政府、大型企业的数据源掌控能力越来越大,数据寡头持有并控制海量数据。这些影响导致了自由市场竞争产生壁垒,对消费者的保护也日益艰难。
另一方面,信息经济学存在天然的“阿罗悖论”,这在1963年的诺贝尔经济学奖得主肯尼斯·阿罗的《不确定性与医疗保健经济学》就已提出:信息(数据)与一般商品迥然有异,它有着难以捉摸的性质,买方在购买前因为不了解该信息(数据)无法确定信息的价值,而买方一旦获知该信息(数据),就可以复制,从而不会购买。
究其原因,在于数据的价值并非绝对确定。相对于不同的应用主体,相对于不同的处理分析技术,数据表现出不同的市场价值。从市场需求角度而言,同样的数据在应用过程中,对于有需求的企业和对于无需求的企业,其市场价值可能存在着天壤之别。
而从数据的处理分析技术角度而言,数据挖掘和整合的深度和范围不同,数据形成的数据产品的应用范围差别巨大,其市场价值也将随着应用范围显示出相对性的显著特征。
于是,在数据交易中,数据需求方因为难以判断数据的质量和价值,可能花了大价钱,却没有获得能实现预期目标的数据;数据提供方也因为缺乏有关需求方的信息,而低报了数据的价格,更不用说其对数据安全和数据滥用的担忧。
因此,对应着数据市场的需求,在大量的数据供应方与数据需求方之间缺少透明、可控的交易桥梁,存在信息不对称、沟通不顺畅等现象。由此,在社会资源配置不合理的大数据交易背景下,既能引导数据资源的合理分配,又能规范交易流程,推动数据流动形成良性循环、创造新价值的大数据交易所应运而生。
数据交易所的未竟之路
2015年是大数据交易平台发展最为迅速的时期。2015年4月,贵阳大数据交易所在贵阳市国资委的支持下挂牌运营,并完成了首次交易;8月,华中地区第一家数据交易所——长江大数据交易中心落户武汉。此后,华中大数据交易所、武汉东湖大数据交易所、河北京津冀数据交易中心也相继成立。
在此期间,大数据交易平台数量规模迅速扩大,市场占有率持续提高,业务范围也在不断地尝试拓宽。
作为第三方中介平台,大数据交易所推动了之前一对一的双边数据市场,使其向“一对多”或“多对多”的网络数据市场转型,也使得大数据潜在的商业价值得到了进一步地释放并逐步形成交易规则,产生定量化的交易指数,数据市场的规模和效率由此倍增。然而,理论是一回事,现实是另一回事。
由于大数据产业市场前景广阔、前期行业的进入壁垒相对较低,许多大数据交易平台性质的企业机构纷纷挂牌成立。尽管多数交易平台在成立之初设立了非常喜人的数据交易目标,但在市场运营中却遭困境。欣欣向荣的发展景象之下,交易市场并没有达到预期的活跃程度。
对我国各大数据交易所的调研发现,五年过去了,但是很多大数据交易所成交寥寥,依然处于小规模的探索阶段。这种乏善可陈的局面显然与数据权属和风险分担不明的法律痼疾有重要联系。
首先,政府、企业以及科研机构等交易主体对数据开放共享的程度、力度影响着数据交易平台的业务范围以及交易质量。在面对巨大的市场需求时,数据本身的商业价值和社会价值依然未被合理发掘利用。
目前,我国数据开放共享的主体主要集中于拥有大数据的政府、互联网企业运营商以及科研机构等多个主体。阻碍开放共享进度的因素则表现在开放共享的理念、完善的平台和技术支撑、成体系的管理监督机制以及最终的开放共享反馈效果等多个维度和多重因素。
以政府为例,对数据决策、现代化治理等的认识不足,使得共享理念仍待形成。即便多数政府部门已经认识到大数据带来的效能,但缺乏成熟的管理机制,更为主要的是对于共享机制探索中出现错误承担责任的躲避。但另一方面,走在开放共享前沿的部门却又面临技术上的现实困境,包括对数据的维护和管理不足等问题。开放共享的壁垒体现在企业之间更多的是竞争关系下,出于商业利益的考量,开放程度并不是很高。
因此,有效的激励主体的参与度和可用性,首先需要融合结构化和非结构化数据,消除数据孤岛。同时,也要打通企业内部和外部的数据,消除数据割据现象。另外,在配套的信息安全保障措施下提升政府企业等主体的参与,共同推进数据标准化建设,完善交易规范,通过响应参与主体对数据的应用需求为导向,撬动数据交易市场更大的潜能。
其次,“一盘散沙”的数据形态难以真正完全释放数据中蕴含的巨大价值。具体到数据的质量及有效性方面,数据价值的最终体现包含多个环节,而原始数据的质量和有效性的缺乏影响了数据交易的质量和准确性。
具体原因在于,一是大多数地区交易平台在规则缺失的市场下自成体系,不相统一的开放格式、数据维度以及语义等共性问题制约了交易市场流畅的沟通。二是数据是否真实、完整、一致,数据质量的好坏直接决定数据资产的价值。三是技术层面的支撑力仍有待提升,数据能否全面采集检索、获取的数据在格式规范上是否便于后续的交互流通、实时有价值的数据能否及时获取、更新、维护等均对数据交易质量产生影响。
显然,随着数据挖掘、分析和利用的深化,要盘活数据价值就需要通过可靠的数据交易让数据流动起来,保证数据被不断地分析与应用才能催生不可估量的价值。
其三,交易安全是保护大数据整体安全的一部分,如果无法保证数据交易的安全,将造成不可估量的损失。
从交易所需要经过的步骤来看,一是数据交易前的任何一个环节出现问题都将造成后期无法完成交易,这样就会导致无论是数据卖方还是数据供应商都将承担违约责任。二是考虑交易场所的安全性,数据交易量大,没有安全的交易场所,就会存在数据黑市中的非法数据交易。而交易场所到底该如何规范,设立该场所又该遵守何种规则,都仍未有明确具体的管理方案。三是数据交易主体的资质和能力也将被纳入安全性考量范围。
这同时也意味着,完成数据交易之前的每一个环节都应受到严格的把控,否则波及的范围将不局限于个人,而是会蔓延到社会和国家,从而影响整体安全。
最后,从数据确权的顶层设计和制度建设上来看,数据界定标准、数据商业化边界、数据定价和数据的交易机制与收益分配路径仍待明晰。
是数据的界定标准在于数据应该的归类和如何界定其边界与归类;数据的商业化边界问题即数据的隐私与商业化的边界问题,包括哪些数据可以用于商业化,哪些数据不能用于商业化的数据商业边界标准;数据的定价问题则是根据数据类别的界定、归类之后所面临的问题,包括数据归类后的数据商业化价值如何定价。
对于数据的交易机制与收益分配,显然,目前的数据大致可分为工业类数据、金融类数据、公共服务类数据以及围绕个人的商业应用数据等四个大版块,前三个版块的数据交易机制与利益分配机制都相对简单,即数据拥有者享受数据商业化权益。
但围绕个人的商业化应用所产生的数据则是数据交易中面临的一大焦点,也就是说这类数据本质上都是由用户个人使用产生的,是属于用户个人隐私行为的数据,这类数据的商业化交易是否应该分配一部分权益归于用户个人至今没有确切规定。
从社会发展的层面来看,大数据交易所是必然要到来的产物,但要从真正真正意义上催收与推动大数据交易所的发展,还需要从根本上解决以上甚至更多方面的顶层设计与制度建设。
就此而言,北京大数据交易中心的成立仍将面临诸多挑战。而建立以大数据交易平台为中心的大数据交易体系,对接数据市场发展的需求,还在路上,仍需思考。