前不久发布的《银川市算力产业发展规划》中提出高水平建设运营宁夏数据要素运营服务中心,完善数据基础制度,搭建银川城市可信数据空间,建设银川“数据湖”,围绕数据“供得出”“流得动”“用得好”三个环节,提升数据汇聚供给能力、促进数据合规高效流通、加快数据资源开发利用。值得注意的是,“数据湖”这一科技感十足的词汇,已经拥有了更高的曝光度。“数据湖”是什么,它到底为推动城市经济发展起到了哪些作用?
“数据湖”是一种存储和处理数据的平台。过去的数据存储处理方式被称作“数据仓”,如同仓库一样,要把数据预先分类处理,然后根据需要调用。“数据湖”更加具有成本优势,不进行预先存储,而是在需要时通过大数据和人工智能等方式,实时调用、实时处理、实时应用。按照规划中“供得出”“流得动”“用得好”这三个环节,“数据湖”本身的应用,必须基于“网络、算力、能源”这三大数据底座。显然,在这三方面,银川都具有一定优势。银川是全国唯一“枢纽节点+交换中心”双中心省会(首府)城市,能源的供应“量大管饱”。此外,DeepSeek等开源大模型也将提供助力。
换句话说,只要我们解决好数据集中存储问题,可以随时“供得出”,让分布于各个城市节点的网络终端的数据“流得动”,最终实现在不同应用场景中“用得好”,“数据湖”便可以不断发挥作用,完成对城市经济发展的支撑作用。
比如,银川要举办一场知名歌星的个人演唱会,根据场馆容量、售票情况、周围交通网络以及安保力量、天气预报等综合因素,“数据湖”中的各项信息会被大数据模型实时调用,通过大模型应用及时提出应对策略,大大降低运营成本,及时调动有关力量,降低安全风险。
从这个例子中,我们可以看出“数据湖”必须拥有极大的数据信息吞吐能力和计算处理能力,这有一个必要的前提,就是将绝大多数信息纳入到“数据湖”中,越多越详细越好,由此形成的大模型决策也就越准确越及时。这要求我们打破数据烟囱,让不同职能部门、不同基础设施以及更多传感器、手机终端形成的信息快速进入“数据湖”,这便需要大量的数据收集、传输和存储设备,对于银川来说,这将是一个颠覆性的“网络升级”。
如果“数据湖”建设能够有序推进,对于银川经济发展的推动作用将非常明显。对包括民生就业、公共服务、城市管理、产业发展等领域,都有着极为重要的意义。我们可以用更低成本,做出更明确的决策,也可以高效参与城市治理之中,让城市运行更加高效。
皇甫世俊