国电内蒙东胜电力

项目背景

           国电内蒙古东胜热电有限公司在生产控制设备智能化改造项目中对大数据 技术的应用提出了更高的要求:它要求生产控制设备智能化改造项目设计,必须 遵从《国电集团公司深化融合信息化规划》(2016-2020)精神,必须遵从集团智 慧企业建设相关规范;充分理解国电内蒙古东胜热电有限公司智慧企业建设思路, 所提供的生产控制设备智能化改造项目在实现本规范要求的功能同时,应能够与 国电内蒙古东胜热电有限公司系统实现数据共享与应用集成,集成内容及效果应 完全满足国电内蒙古东胜热电有限公司智慧企业建设需要;其次,生产控制设备 智能化改造项目各类硬件和软件技术要求必须符合国电电力智慧企业建设电厂 统建类项目有关技术要求,并提出了技术方面和其他有关方面的要求。它包括功 能设计、系统设计、性能要求、安装、调试、运维保障等方面要求。

   而针对国电内蒙古东胜热电有限公司对海量数据的处理与应用需求,Hadoop 刚好可以完美的满足这些应用需求。

        首先,Hadoop 提供清晰而简明的编程实例、接口文档以及丰富的案 例样本代码,以帮助开发者快速开发跨平台物联网应用,并通过商业 Hadoop 公 司提供全方位的技术支持。同时,Hadoop 平台支持 HTTP(s),FTP,SFTP,MQTT 及 TCP 等接口协议,并可以自定义第三方设备数据上报接口,允许各种智能设备的 接入,且数据查询可支持百万级别 QPS,并以分布式数据存储节点策略优化数据上传下载速度。

        另外就是商业 Hadoop 提供了完善的身份验证手段,用户分别通过 Kerberos/LDAP 以保证数据访问安全以及设备数据安全。此外,平台设置了不同 级别的数据访问权限和访问级别,提供多用户多应用的数据隔离机制以及专业的 数据副本机制,保证用户数据不丢失,不泄露,也不被盗取。

        性价比,Hadoop 分布式文件存储支持弹性扩展,存储空间可以保持海量规 模,支持 PB 级别的数据存储以及横向无限扩展,可保证数据的实时性与准确性, 即为用户提供一站式的数据存储和处理解决方案,使之专注于业务开发和规模扩 展。另一方面,Hadoop 的应用只需低廉的开发和运维成本,多样化的工具可满足 用户应用原型开发、产品商用和运营管理等各阶段需求。

项目目标

        工业4.0时代,所强调的不仅是基础自动化和传感器所带来的大量数据,更重要的是,应该将这些数据与具体的业务过程建立联系,进而与这些业务过程所要实现的管理目标建立联系,就是说,基于大数据的成本分析模型,其核心的评价指标就在于成本管理上为企业带来的新增效益。伴随4.0时代底层和终端数据的丰富,为成本模型的丰富和完善,带来了新的可能性。在大数据体系支撑下,将业务数据汇总到统一的平台,并提供统一的数据接口标准。

        数据的真正价值在于数据驱动决策,通过数据指导运营。通过数据驱动的方法判断趋势, 帮住我们发现问题,继而推动创新或产生新的解决方案。随着企业数据爆发式增长,数据体 量越来越难以估量,我们很难说清楚我们到底拥有哪些数据,这些数据从哪里来,到哪里去, 发生了什么变化,应该如何使用它们。因此元数据管理(数据治理)成为企业级数据湖不可或 缺的重要组成部分。


总体解决方案

       

        通过对源数据的整理和分析,按照数据格式,数据存放方式,数据时效性等相关内容。开发不同的数据接口将数据通过统一的数据ETL采集接口,并按照需求存放于HDFS/HIVE,KUDU,Kafka等组件中。在平台上,有统一平台管理监控组件(Cloudera Manager)用于监控平台的资源使用情况;有统一的资源管理组件(YARN)为上层应用做统一的资源管理调度;有数据可视化查询工具(HUE)将大数据技术栈整合将通过统一的WEB UI 来对数据进行管理和查看等。

        数据落地到大数据平台后使用atlas对数据进行一个统一的元数据治理工作,用以构建其数据资产目录,对这些资产进行分类和管理,并为数据科学家,数据分析师和数据治理团队提供围绕这些数据资产的协作功能


网络部署架构

        在网络拓扑设计中,大数据服务器用两台万兆交换器来管理,用于大数据平台数据内部交换,大数据交换机接入核心交换机后,从镜像接口机中获取SIS,MIS,DCS等业务数据;因为底层DCS、NCS等生产控制系统在一区,中间有网闸隔离。

        在大数据网络内部,有两台管理节点服务器,安装部署管理角色,其他服务器作为数据节点。网络方面每台服务器两个万兆网卡分别连接两台交换机,提高容错率。


项目成果

数据平台的建立

        通过生产控制设备智能化改造项目的实施为国电东胜电厂构建一套以大数据 平台为数据中心,用以存储火电厂的生产,设备,财务管理,人员管理等多维系 统的数据,这些多维系统数据通过数据治理实现数据的标签与分类,让它们在统一的平台之上可以更容易被使用;通过实时接入到大数据平台的技术,为后续智 慧电厂的开发平台、算法平台、报表平台提供了数据消费基础。通过数据平台的数据支撑,报表平台可以实现业务系统的实时报表展示;算法平台可以实现业务 分析和算法模型。通过大数据的电力设备状态监测多维信息聚合方法。建立电力 设备多种状态量的多维支持矢量,用历史数据进行训练,形成一个可以不断生长的电力设备状态支持矢量集,通过对状态监测数据与支持矢量集之间的相关性分 析,实现对电力设备运行状态的评估与决策,进而实现发电设备全寿命周期管理。 再建立基于机器学习的诊断知识专家库,针对设备参数预警信息,自动匹配故障 知识库信息。利用大数据进行设备故障预警诊断会有效提升设备状态监测、评价 与诊断的及时性、准确性和快速性,提升设备维护员的工作效率,改变设备维护 员的工作模式。使计划检修向状态检修转变。


数据的集中存储

        火力发电企业的发电大数据主要集中在锅炉、汽机和电气等设备的运行过程中,通过接入多个业务系统数据 SIS、EAM、OA、人员定位和安全管控、视频识别跑冒滴 漏、数字化煤场系统(含输煤巡检机器人)、燃料管理信息系统、燃料全过程管控系统、厂 区门禁系统、视频监控系统,已经积累了丰富的历史数据,可从挖掘电厂的节能降 耗角度出发采用大数据挖掘方法挖掘出潜在数据价值。通过引入模糊粗糙集理论 建立火电机组能耗特征变量选择理论,建立基于机组历史数据驱动的燃煤发电机 组能耗特性建模理论与方法。建立可准确揭示机组能耗与多变的外部资源环境、 设备特性以及运行控制水平之间内在联系的燃煤发电机组精确能耗特性模型。在 可比历史边界条件下寻优确定机组实际可达优化目标值,建立对应于机组当前运行边界、设备特性和运行工况的各类损失及其详细分布的诊断模型;构建出燃煤 发电机组性能优化与节能诊断知识库,实现机组在线运行优化与节能诊断


项目完成详细列表


序号

项目服务内容

1

集群硬件环境准备

1.1

磁盘配置 RAID 模式,安装操作系统,绑

定万兆网卡

2

集群安装

2.1

集群环境前置条件准备

2.2

集群服务安装

3

需求调研及技术选型

3.1

业务系统对接梳理

3.2

选定技术实现

4

数据导入开发

4.1

开发 SQOOP 导入程序导入到 HDFS

4.2

开发实时接入程序接入 DCS、NCS

4.3

开发部署 StreamSets 管道进行 OA、EAM、

燃料管理、无人值守业务系统实时数据接 入

5

数据治理

5.1

数据标签规则制定

5.2

按照指定标签规则对数据打标签

6

集群系统试运行

6.1

CDH 集群功能测试

6.2

CDH 集群基准性能测试

6.3

集成测试

6.4

业务系统数据接入测试

6.5

数据治理测试