ZKX's LAB

北京易华录高级副总裁孙建宏:数据湖是城市发展数字经济的必由之路

2020-10-18新闻21

2020年10月15日上午,由北京市地方金融监督管理局指导,中国邮电器材集团有限公司、零壹财经·零壹智库联合主办的“2020年国际金融科技圆桌论坛”在北京国家会议中心隆重召开。

会上, 北京易华录信息技术股份有限公司高级副总裁孙建宏就数据湖理念、框架、优势以及发展路径等做了详细的介绍。

北京易华录高级副总裁孙建宏:数据湖是城市发展数字经济的必由之路

北京易华录信息技术股份有限公司高级副总裁 孙建宏

孙建宏介绍:发展数字经济,提升社会治理现代化能力,数据是核心,但安全和用得起的数据是必要条件,数据主体在民、主权在国是基础。城市全时全域全量数据,规模巨大,必须存算分离;热温冷数据必须分层存储;数据是生产要素,必须由政府监管掌控;但数据价值释放在各类场景,必须由企业和市场主导。

我们对大数据的理解是:大数据的5V自然属性, 大规模、低价值,必定需要 超级存储、超级计算;大数据的5I社会属性, 融通流动才能激发数据最大价值,必然需要构建 数据银行;大数据的 时空连续属性,必然构建 数字孪生、数字永生。

自2016年,北京易华录信息技术股份有限公司(下称“易华录”)以 努力降低全社会存储和使用数据能耗和成本为企业使命,依托 全介质全场景湖存储关键技术,以数据湖园区的方式,探索和实践政府主导建设的、节能优先/低成本使用的“城市全域全量数据”“分布式”“收存-挖掘-融通”的、实现AI普惠的区域性及行业性数据湖,以“ 低成本汇聚、规范化确权、高效率治理、资产化交易和全场景应用”的新发展模式,实现由数字碎片化走向规模化、资源化、资产化、证券化、产业化。

IDC和数据湖的区别在于,IDC是以计算性能为优先的,而数据湖是以节能和存储为优先的。城市发展数字经济所需全域全量数据,热冷数据必然呈现出明显的28原则,易华录提供的数据湖就是采用全介质、提供全场景存储服务的优秀方案,所以,数据湖就能够承担起全时、全域、全量的收储和融通职责。

对于全时、全域、全量的温冷数据收储和流通,蓝光技术是安全、高效、低成本的优秀解决方案。孙建宏介绍,在存储密度上,现在一张300G的蓝光光盘相当于59张DVD-5的存储。每12张蓝光光盘组成一个光盘匣,76个盘匣组成一个存储单元,一个47U单柜的存储容量可以达到1.64PB,这样一个高密度的存储方案就满足了我们对海量数据的存储需求。

另一方面是它的IO能力,每一个机柜可以配1—3个光驱组,每组三个光驱,每个光驱两个激光头,单组光驱读写速度峰值与磁盘接近。

蓝光存储柜支持集群,形成一个超大规模的存储平台。

在安全优势上,光盘具有一次写入防篡改的功能,防病毒破坏,防电磁攻击。

在节能优势上,每个机柜待机功率只有7瓦,是磁存储的千分之三。我们测算1PB数据存储30年,蓝光存储是磁存储成本的6.5%。

因此,SSD、HD、磁带、光盘构成的全介质全场景湖存储方案,必定是进行城市全时全域全量数据收储融通的优秀方案,并且光电磁一体化云存储平台被列为工信部发布的第一批《绿色数据中心先进适用技术目录》。

易华录数据湖经过4年研发运营实践,与生态一起构建成完整的产业链。

在光存储生产上,我们拥有中国最先进的生产线,从原材料到关键件,具备完整的量产能力;在湖存储的关键技术上,易华录有核心技术能力;在生态上,易华录有400多家上下游生态伙伴;在运维上,易华录旗下有国富瑞,有商务部20多年大型数据中心的运维经验。在大体量核心生态伙伴上,华为、联通、移动、旷视、比特大陆、寒武纪,分别从“存、算、网”三部分,和数据湖构建了完整的能力。在存储上,华为的OBS和蓝光GDAS无缝对接,并且华为与华录集团签署了合作框架,双方在技术和市场上形成优势互补;在AI能力上,数据湖提供大规模现货数据,比特大陆、寒武纪提供算力,易华录提供自有算法,加上旷视科技等合作伙伴的算法能力,这样在数据、算力、算法上形成了一个强耦合;在网络上,易华录和联通、移动,无论是在网络资源还是在运营商的市场也达成了很好的合作,云湖在联通已经覆盖了10多个省。

孙建宏表示数据湖未来有三个发展路径,在善政、惠民、兴业上,向城市大脑、数字综合体、智慧城市、数字孪生城市演进;在数据融通上,发展成为区域性、行业性的数据银行;在文化传承、城市记忆、家族个人等方面,走向数字永生。

IoT数据,尤其是视频数据如何显著丰富政务数据资源来服务城市大脑呢?

目前无论是二、三线城市,还是一线城市,视频规模达到2—3万,5—7万,甚至10万以上,摄像头规模巨大,但是从采集到感知分析到应用的链条来看,存在较大的问题。目前视频数据存储时间是15天—60天,很多数据在没有被看见的情况下就被覆盖掉了,而其中有大量丰富的数据值得我们去挖掘。

因而易华录和鹏城实验室数字视网膜形成了很好的合作,湖存储提供安全廉价存储,视网膜通过统一的协议能够把全市、全域、全量资源、算力、算法统一调度起来,形成分布式分级结构化能力,形成可以标签化,可以大规模检索,是走向认知计算的丰富资源。

视频可类比为“万金油”,结构化后的视频信息可广泛应用在治安、交通、教育等方面。

孙建宏举例说,比如治安上,原来侦破案件需要翻阅大量视频回放寻找蛛丝马迹,在我们全量、全域结构化之后,类似通过鞋帽背包步态等特征锁定嫌疑人的应用,都可以轻松实现。交通方面,断面检测必将向场检测转变,OD、排队长度、反溢失衡都轻松判定;教育方面,学生上课注意力、课程喜好、同学间关系、校园欺凌、师生关系等都不再是盲人摸象。

数据银行,安全高效驱动数据要素融通。

孙建宏说,基于数据湖的数据收储、确权、治理、产品化为交易提供准备。数据产品的共享、开放、服务是融通交易的主要形式。易华录在安全、合规的原则下,积极探索数据开放、交易、众包、抵押担保、数据招商等激活数据资产的应用形态。在无锡,易华录用这种方式,将部分视频数据、动漫数据素材等已经进行了实践。在政府的监管下脱敏,合规,探索资产评估、上架、销售定价、交易结算的最佳落地实践。

数据湖,在全国主要是通过数据湖园区落地运营的,其完整的模式是“一湖、一园、一院、一脑、一银行、一基金”,让数据-技术-人才-资金-产业能高效的协同起来,真正推进地方数字产业落地。

孙建宏说,易华录数据湖经过这几年的实践发展,已经解决了大量关键的问题,比如说建设模式、技术架构、引水方式、数据安全、数据治理、开放授权等等已经清晰,数据湖运营走向了落地。

目前已经在建、在运营的数据湖,全国有30多个,在接洽中的也有70多个。我们以数据湖为抓手,助推各地发展数字经济——要像每个城市建图书馆一样,要为每个城市建一座数据湖,让数据要素收储融通起来,实现数字城市,走向智慧社会。

#孙建宏#城市#数据湖

随机阅读

qrcode
访问手机版