〔译〕基础能源公司如何从大数据中获益

原文刊载于工程与技术杂志(Engineering and Technology Magazine)2014年第一期,水平有限,翻译之后读起来反而更费劲了。

在欧洲,面向商用和民用的供电、燃气、供水公司为了深入了解用户趋势、提高效益,都在寻找方法分析它们的智能系统所产生的海量数据。

基于智能仪表、智能电网和强大的客户关系管理系统(CRM),在公共服务业的新时代里,公共事业公司们正热衷于分析开始被产生出来的海量数据。欧洲的电力、燃气、水供应商们开始探索如何通过「大数据」分析处理大量的信息,无论这些信息已经存在,还是即将产生于不断问世的大量智能仪表。

市场分析机构 GTM Research 预测,随着水、电、气的供应商们在世界各地区增加投资,全球的公共事业在数据分析上的支出将从 2012 年的 7 亿美元增长到 2020 年的 38 亿美元。提及那些期望采用 Hadoop 的数据管理平台以及大数据大规模并行处理(MPP)等技术的公司,GTM 的 David J Leeds 将此种对数据分析软件的重视描述为「对公共事业的一次再创造」。

时至今日,对于分析软件的应用已经些许超越了传统的智能商务和用于市场分析的数据仓库工具的范畴,随着专用硬件和大数据处理平台的发展,对于数据的处理能力正在不断提升,更快地过滤、分析,以及从大量数据集中寻找有意义的信息变得可能,并且正在超越这些主要的应用场景。

防止客户流失是许多公共事业公司要面临的问题,尤其是在没有政府政策门槛的市场,有更多的竞争者通过限时低价的方式争夺潜在客户。通过对诸如用户的信息与能源用量、打包价以及针对特定企业和个人用户的优化定价等数据的统计学分析,供容易找到它们中的内在联系。此外,从社交媒体网站产生的信息中还诞生了「趋势分析」这个东西——通常指的是对于当前定价和服务水平的客户满意度的分析。

「数据过去就有,只不过现在数据的量更大了,但同时也产生了过去得不到的新数据,」软件方案提供商 SAP 的能源方案主管 James McLelland 说道,「我们发现一些有趣的用例正在诞生出来,多数是在智能仪表分析和智能电网方面。」

分析信息的过程遵循一个标准的模式。原始数据从智能仪表、电网上的传感器、工业设备、数据库、收集点或其他设备上采集起来。之后通过某种形式的远距离通信、射频识别(RFID)或有线/无线网络传输至服务器或专用设备上,这些服务器或专用设备只负责单一的工作——清理数据。这项工作以往由「大型数据仓库」实现,但现在通过 Apache Hadoop 集群和内存数据库(此类数据库将数据存储在内存中而非硬盘中)可以大大地提速这一过程。Apache Hadoop 是可运行在商用硬件集群上,用于数据存储和大规模数据处理的一款开源软件框架。

在「脏数据」(重复的或不完整的数据)被清理掉之后,剩余的信息被发送到分析引擎,在其上运行一系列的算法,这些算法即所谓的「秘密配方」,被设计用来寻找数据的内在的意义,以便之后用于第三方报告或数据可视化软件。

智能仪表拓展了数据的疆域

对数据规模的精确估计即便可能,也很难做到。SAP 的 McLelland 相信,在智能仪表的帮助下,未来由能源设施产生的数据规模将从几 G 字节上升到几千 T 字节的数量级。另有来自 GigaOM 网站文章估计,智能仪表的普及将在全球产生每年百万 T 字节的数据。可持续能源中心(Centre for Sustainable Energy, CSE)是一家由公共、私人、志愿者组织组成的联合机构,其目的在于探索应对日益严重的能源消耗和气候变化问题的技术和方法。

2012年,它们与「西方配电」、「苏格兰及南方能源」、「布里斯托大学」合作发起一个项目,开发一套名为「基于 Hadoop 的智能仪表分析」(Smart Meter Analytics, Scaled by Hadoop)的大数据平台原型,根据其设计可以存储、处理、收集最大 20TB 大小的数据集,相当于13个家庭一年产生的数据量。

毫无疑问,智能仪表的部署提高了仪表读数的读取频率,CSE 估计,英国消费的一半电力是每 6 个月才读一次读数的,尽管电价计费是以半小时为单位的。CSE 还解释道,目前的表计读数无法提供一天中不同时段的用电情况,而这些数据对于建立精确的用户档案十分关键。

“我们期望能源用户能参与到公司的决策中来,”英国国家电网输电未来策略团队的 Mark Osborne 解释道,"过去,你所能做的只是每季度得到一张账单,或者去 uSwitch.com 换一家服务商。但是如今你可以选择在早晨或傍晚电费便宜的时候洗衣服。"

E.ON 集团,一家覆盖全球30个国家的跨国公司,已经与瑞典电信设备供应商「爱立信」建立合约,于 2013 年至 2018 年期间在瑞典安装超过 60 万个智能电表,此举被描述为迈向实时大数据计量的重要一步,以便为 E.ON 的客户提供精确及时的用能信息。

(未完待续)