李晓钢举例说:“实现了数据融合之后,我们才有条件在经济运行服务平台,选择一级政府或者一个企业做研究对象,为它建一个活档案,与这个研究对象相关的数据就会随时间源源不断地汇聚进来。但这个时候,可能存在多对象存在关系,就象我们坐出租车,在你乘车这一段,你和车和司机就有时空关系,而过了这个时段你们就没关系了。这种对应关系用传统的数据库关系来处理,往往你就没有办法实现数据的联系,而采用时空关系描述,一切问题就都迎刃而解了。” 说起东方通的大数据秘密武器,李晓钢强调:“我们回到经济运行服务平台来说,就一定要记住经济运行服务平台是服务于政府决策的。现在的技术人员不要神化大数据,对外宣称现在我们有了大数据技术,原来办不到的事就全好办了,大数据只是服务于政府决策,最后办事情还要取决于政府的业务能力。基于这个出发点,大数据技术人员一定要站在业务专家的背后,默默地提供数据支持。” 也许有人会不认同这件秘密武器,但李晓钢则坚持认为:“这实际上在大数据建设中非常重要,象东方通给北京公交集团设计的通过大数据分析实现节油的系统,北京公交集团一年的油耗就是十几亿元,能降1%就能省出一千多万。但在实际操作时,情况就太复杂了,效区车和市区的路况大不一样,早晚高峰和平时又大不一样,不同的路线中的红绿灯情况千差万别,不同驾龄的司机和不同排量的车混在一起。这个时候,我们的实施人员就是默默地站在研究了一辈子的行业专家后边,人家提什么需求,我们就融合什么数据。最终行业专家表示,以前提需求后,几年也拿不到的数据,现在几星期就出来了。我们根据专业的数学模型,提出了哪类车进北京后最省钱。最后我们发现并不是最先进的车就好。” 建设大数据平台的思路 眼下,如果我们在搜索引擎中搜索“大数据”三个字,我们会发现与政府相关的大数据项目的报道,几乎占满了搜索引擎的前三页。这从一个侧面说明,服务于政府的各类大数据项目正进入到一个开发热潮当中。为此,我们请李晓钢谈了大数据平台的建设思路。 李晓钢认为:“政府领域大数据平台建设过程中,要注意的点有很多。具体到象经济运行服务平台的项目,我认为有两点非常重要。一是坚持微观、中观和宏观的结合,我们才能做到以实证为核心;二是做到按需服务。” 对于微观、中观和宏观的结合,李晓钢谈了自己的看法:“我们把企业这端定义为微观,产业定义为中观,政府层面定义为宏观。我们做个假设,就是企业这端的微观,汇合在一起,就是产业中观,政府在宏观层面要面向不同产业中观。现在政府相关领导需要一个实景图,把所在城市的经济活动从宏观、中观和微观这几个维度都看清楚,这个需求有落地有相录的难度。这个过程一是做好数据融合工作,同时也需要建好实证模型。但利用大数据建模,实际上非常困难,因为每一个地区经济特点、发展规律、产业结构都不一样,要让实景图发挥作用,就只能拿数据和当地的环境之间做出一个适用于当地情况的拟合模型。” 在现实工作中,许多经济学家和统计学家都在试图找出各种经济组织运行中的经济规律,李晓钢表示:“我们完全可以提供数据源,然后和这些经济学家、统计学家携起手来。经济运行服务平台是一个大项目,单靠东方通一家也不可能完成这样大的一个体系,因此我们希望政府、各行业和领域体系的专家、学者都能参与到经济运行服务平台这个空间中来。” 而说到按需服务,李晓钢认为这更是一个不可或缺的因素:“政府各个部门寻求大数据决策支持时,往往采用不同的维度,这样政府内部各个部门的需求就都是个性化的,但不需要也不可能为每个个性化需求建一个支持平台,采用大数据的方法对数据进行融合之后,政府各个部门所需的复杂计算,都应当能从经济运行服务平台的数据中迅速提取出来。所以在政府大数据平台建设之初,设计的数据结构就要能把各部门的数据融合进来,形成一个大的运营环境。” 以往政府各部门因为分工的原因,各部门的数据往往容易形成一个个数据孤岛,大数据技术的出现就是为了打破这些数据孤岛,把它们串起来形成一个可用的“一”。但如果政府大数据项目本身又制造出了数据孤岛,这无疑是和大数据应有的初衷相背离。 李晓钢最后强调:“像经济运行服务平台这样的大数据平台,当它实现了微观、中观、宏观的贯通之后,往往政府购买服务的钱是小头,各企业购买其中服务的市场潜力可能远远大于来自政府的钱。同时,这样的平台实际上打造了另一个产业链,在其中,不仅政府可以参与,传统企业、IT企业和经济统计学家,也完全可以在这个链条上打出自己的位置。这样,像经济运行服务平台这样的大数据平台真正被运营起来,它的生命力才会完全展现出来。” |