10月29-30日,"第四届全球未来出行大会(GFM2020)"在德清隆重召开,本次大会由中国电动汽车百人会和智能汽车与智慧城市协同发展联盟联合召开,旨在探讨未来的城市、未来的出行、未来的汽车如何为居民提供更加经济、便捷、安全、科技友好的新出行方式。下面是上海市新能源汽车公共数据采集与监测研究中心副主任丁晓华在本次论坛上的发言:
上海市新能源汽车公共数据采集与监测研究中心副主任丁晓华
感谢百人会给我们这个机会,把上海新能源汽车数据中心在如何利用这些数据的情况向各位专家做一个汇报。
上海新能源汽车数据中心是上海市新能源汽车的地方平台,目前数据采集总量是37万辆,采集标准按照国标GB/T32960,主要分析目前集中在整车数据、车辆位置数据、集聚数据,报警数据用得不多,因为报警数据中的噪声非常大,很难用好。这些数据多数是30秒,现在提高到了大约10秒,但是依然还存在很多问题,所以我们在修改上海新的地标,主要改变一是采集频率提高到了1秒,二是增加了所有电池包内全部子系统的单体电压和全部子系统的探针温度,这两项其实国标在实施过程中已经在做了,只是我们用地标的形式再把它增强了一下。另外增加了方向、坡度、踏板等等,主要是这些数据在城市和交通中还有非常大的价值。
采样数据以后,我们目前从四个方向在做一些服务:
第一,出行;
第二,充电;
第三,电池;
第四,开放。
后面会结合几个案例进行展开。
出行。
左图是按一天24小时不断地在滚,可以看到全上海新能源汽车用户随着小时的变化,也就是这些所有的数据都是基于时空的,我们不仅仅是简单分析这些用户的行驶里程、时间、高峰,因为这些数据背后是时空,就带来了很多价值,如杨院长讲的需求侧响应,需求侧响应不能讲一个城市,讲一个城市意义不大,因为一个城市的供电量基本是不会有大问题的,问题都出在一个局部。电网叫台区,台区是波动很大的,负荷也是波动很大的,基于此图可以知道,你在什么点是充电的,充了多少能量、充了多少时间,很多响应就可以做。右边点也是一个行为,这是整车企业委托给我们的项目,他关心虹桥枢纽用户终点这些人从哪里来的,这是很粗线条的,从行政区来看,到虹桥枢纽的新能源汽车用户最主要来自于闵行、青浦、浦东,似乎没有什么大意思,但是这个东西再往下分,如果把它变成一个一个小区的空间或者网格空间,它的行为出行就带来了很多变化,可以从一个虹桥枢纽扩展到城市的任何一个角度,反过来讲,很难回答清城市的职住分离情况(指车辆出行)。新能源汽车占比越来越高,上海基本占比达到8%~10%,再往下发展,每年以8万辆~9万辆速度在增加,而且大多又是私人用户,这样的信息可以对城市规划和交通规划带来很多价值,也对如何优化公交出行带来很多背景数据。
出行中还有一个很大的问题,大家都说插电式混合动力用户,电的贡献有吗?因为插电式混合动力可以用油,如果消费者不用油怎么办,没有充电桩怎么办?先不讲如何让消费者有充电桩,就从上海13万以上的车进行评价,它们到底用电行驶的分布是如何的?右边是结论,算法是清华大学的贡献。因为混合动力车很难算,如图,第一是电网充满以后再出行,所以是来自电网的贡献。第二当SOC(荷电状态)低到一定程度时,油会自动对这辆车电池充电,后面这一段贡献是油对行驶里程的贡献。第三是真正油的阶段。但是从这里可以看到,一定要把不同阶段解耦,然后进行分别计算,我们利用清华大学这个算法,大致把上海用户分布做清了。这是一个总图,在这个基础下还分了很多,如果用户是车队是怎么样的,私人购买又分了三种,私人作为上下班用途的通勤特征,私人去做网约,私人兼职做网约,全是不一样的,因此我们要从算法里切分出来做分析。再下一步,不同车型的技术架构不一样,50公里纯电里程、60公里纯电里程、80公里纯电里程,在用户的实际情况下是怎么样的,又可以切分出来。所以数据在这一块是可以做很多回答的。
充电。
左右两张图是我们根据上海市交通委的要求做的一个电力研究,一个是特斯拉,一个是自主品牌的,大概有4~5个品牌,我们只看了短短35天。左图可以看到有聚合点,右图没有聚合点,或很少聚合点。聚合点都是特斯拉的超充,这一个圆越大点里充电负荷越多,也可以按照充电车辆来聚合,聚合有各种各样的方法,但从这里可以看到充电在24小时分布都能做出来,大多数晚上10点钟一个高峰,非常非常高,是其他时间的5倍。这就带来了电网负荷响应的问题或者调优的问题。国家规定新建基础小区百分之百有充电桩,每个停车位要配充电桩,但我们数据分析发现消费者的充电时长基本上5个小时,因为消费者不会把电开完的。既然是5个小时,一天晚上有10个小时,如果一个桩两把枪,把相邻两个车位分时充电的话,其实是不需要每一个车位都要一个桩,也就是电网负荷的配置发生了变化,否则就会有很大的冗余。国网也对上海消费者分析过,哪怕家里有一个桩,充电的时长一年可能也就800个小时,富余容量非常大。数据分析在如何配置电源负荷、如何有序充电、如何需求侧响应,都带来很大的潜在价值。
电池分析。
我们和一般机构不一样,一般机构更多是偏研究,我们是数据准备,我们把所有的采样数据处理成动力学特征的数据库,这种特征数据库每一个场景都是略有不同的,电池研究有电池研究的特征数据库,出行是出行的,电网需求是电网需求的,交通是交通的,这些不一样,最重要的是回答三个问题,健康度的预测,这辆车现在电池容量的衰减和电池不一致性,做电池不一致性最主要的目的是要帮助车企做主动维护,如何在这些繁杂的数据里用什么样的工具或算法找出不一致性。
我们有大约670个车型,有将近100家厂家,它们既有纯电的,又有插混的,还有车是物流或乘用、客车,电池材料也不一样,用户特征也不一样,车型又不一样等等,这些从我们数据中心角度都要做好准备,而不是让用户从底层数据直接去做,这是不现实的,而且数据有很多质量问题,不经过处理,把原始数据向用户开放,那一般你的项目实现50%都在处理数据上。
我们这个平台主要是把基于电池研究的工况数据标定好,然后也做一些特征工程的训练,能理解真正实际场景,最后实现容量的预测、异常状态的识别、寿命的预测和退役电池价值的估计。
这是我们系统的实现方法,也就是说底层是我们的原始生产库,中间是我们做的特征库,最后是各个供应商都可以有算法包加上来,通过API接口服务于C端、B端等等。
清华大学一个毕业博士在上海,年底会把他的算法上线,服务的就是后市场。一辆车在转卖过程中,大家最担心的是这个车的电池还健康吗。我们做不到95%和98%的识别,因为我们用的是工程数据,但是我们可以做到优良、中、差有把握的。另外一个问题,后市场的电池残值评价本来没有标准,因此我们先通过实际的应用,通过市场,来慢慢训练和完善这个过程。我们认为后市场已经具备了应用价值,所以年底会上线。
总之,中间这块是我们的主要工作,有质量保障的数据库、有标签标定的数据库和经过验证的算法,而下面是各种供应商,你可能是数据的供应商,也可能是算法的供应商,比如需求侧响应是负责复杂的东西,有算法供应商。为什么说很复杂?我们和电网交流过,电网希望你的用户是固定的,我凌晨3~6点是最希望你们充电的时间,但希望每天给我响应,如果不每天响应,一会儿是这个、一会儿是那个,没法控制,负荷没法保障。怎么办?其实我们的基数很大,不一定要固定一个人,其实固定一个量,只要能保障这个量就行了,这里就有很多创新的点,所以有算法供应商。上面是各种需求方,学校和研究机构今天可能是利用我们的数据在训练算法,但未来成熟了就是供应商,我们提供的主要还是数据。基于此,我们必须要做开放。
我们大数据的开放首先不能说把裸数据开放,一定要经过场景识别后的应用开放,这个过程中要做好标签标定,要有数据支点。
案例,上海一天的道路,可以看到,随着不同小时,路网密度发生了变化,我们为什么要把它配上来?配了这个以后,把一段一段准备开放,因为隐私是不能开放的,真正的消费者从哪里来到哪里去两个点,O和D是不能开放的,这是隐私,但是当你的车从原始O点开到第一个支路口时,之后你就是一个交通流数据了,到你从最后一个支路口下去前这一段,你也是交通流动,没有隐私,这两段我们切掉,剩下的就是流数据,这些流数据干什么,我们也不是太确定,它一定能干什么,因为现在交通领域大多数大家用的都是手机心力,我们是基于从车,从车数据至少能回答几个问题,比如无人驾驶之中左转和右转到底等待多长时间,左转多还是右转多,等等这些实际的数据,道路随着气候、季节、节假日的变化情况它是一个动态,这些数据有没有用。
第二整车企业会问我们,在上海一个用户到底一年在城市道路、高架道路以及高速道路开的占比到底是什么?这里头很有可能和电机的MK2有关等等,这些基于实际而不是抽象工矿的数据,希望通过我们的整理开放给大家,让大家来做,因为你们场景变化太大,我们没法全部兼容,我们也不懂这种应用,所以我们通过开放的模式来做,目前有一个开放实验室,大家可以在实验室里看见一个数据,最终做我们自己的中台,但是不好做,通过中台可以远程两做一些数据应用,总之希望通过这个更好的用数据给大家服务。
这边是正在建的多平台,第一已经建成的大数据平台,第二电池溯源,已经建成了,下面就等政府的文,电池在流通过程中分别去了哪里,编码要跟上,随着加氢站的监测平台现在已经在开发,将来在上海所有的氢车和站的数据都要融合起来,现在氢车大概现在有1400辆上海运营,智能网联这个平台将来底层放在一起,严格意义上来讲它不是我们的,随后这些数据我们在城市上看如何用,GEF6能源管理平台,包括V2X和氢能能源的响应这是一个项目,这里头将来产生什么,我们还不是很清楚,通过项目在摸索。
最后想服务的政府和市场。
我就讲这些,谢谢大家。
(注:本文根据现场速记整理,未经演讲嘉宾审阅,仅作为参考资料,请勿转载!)