河南移动项目项目背景河南移动作为“中国移动通信”网络的有机组成部分,河南移动经过多年的建设和发展,建立了一个覆盖全面、质量可靠、功能完善、业务丰富、管理先进、世界一流的综合通信网络。目前,河南移动网络已覆盖了全省所有乡镇和行政村,话音核心网容量达到7500万户以上。 本项目对河南移动现有Hadoop集群进行统一管理、运营、维护,实时监控现有Hadoop集群运行状况,保障Hadoop集群服务及业务的正常运行。 项目目标Hadoop集群监控运维管理 Hadoop集群性能调优 Hadoop集群故障处理 Hadoop集群平台升级、安全加固及集群扩容 对Hadoop平台测试、部署及组件培训 解决方案每天进行Hadoop集群巡检,对Hadoop集群运行情况进行实时监控,持续跟踪分析Hadoop集群的日志信息,及时预防问题的发生。为河南移动Hadoop集群服务正常运行保驾护航。 对河南移动现有Hadoop集群运行情况进行性能分析,定时进行基准性能指标提取,例如:HDFS的读写性能,定时检测磁盘IO指标、CPU指标等。根据集群系统实际情况对Hadoop集群进行调优。调优完成后,进行基准测试对比,保障调优效果,提供调优总结报告。 针对集群故障诊断排查,故障处理及恢复, 硬盘故障:在不影响业务、不停止整个集群的情况下更换损坏硬盘,并保证数据不丢失; 主机故障:在主机故障期间保证业务及集群正常运行,在主机修复后使故障主机自动接入集群,并保证数据不丢失。 针对硬件、软件或是网络故障提供故障诊断分析和解决问题,提交故障解决报告。 驻场服务响应体系:7*24小时全年无休的电话支持,5*8小时的现场技术支持。 Hadoop平台升级、安全加固及集群扩容: 集群扩容:提供集群扩容方案和详细的扩容步骤及操作说明,实施在线扩容,并保证扩容成功能进行数据均衡,分析扩容前后系统在存储能力,计算能力方面的提升。 Hadoop平台升级:hadoop平台升级操作,保障升级效果要先在测试环境验证升级步骤,测试环境升级成功后在升级生产环境,如果升级失败实施回退方案。升级过程保障数据不丢失。 Hadoop平台安全加固:配合河南移动对Hadoop集群进行安全漏洞扫描,对发现的安全漏洞机型梳理及整改,并提供安全加固操作文档。 对Hadoop各组件增强功能培训。 项目成果驻场运维河南移动现有Hadoop集群,通过每日巡检,持续跟踪分析Hadoop集群日志信息,及时预防问题的发生,为河南移动Hadoop集群服务及业务运行保驾护航。 |