xiaoyoubaobei
一、事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。在这方面主要工作内容有:
1、问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。
2、问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。
3、问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。
二、变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作。在这方面主要工作内容有:
1、配置管理:通过配置管理平台(自研、开源)管理服务涉及到的多个模块、多个版本的关系以及配置的准确性。
2、发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。
三、容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之。在这方面主要工作内容有:
1、容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。
2、容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案。比如通过调整系统参数、优化服务部署架构等方法来高效的提升系统容量。
3、架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。
扩展资料
一、无论做什么运维,运维工程师最基本的职责都是负责服务的稳定性,确保服务可以7*24H不间断地为用户提供服务。在此之上运维工程师的主要工作职责如下:
1、质量:保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。
2、效率:用自动化的工具/平台提升软件在研发生命周期中的工程效率。
3、成本:通过技术手段优化服务架构、性能调优;通过资源优化组合降低成本、提升ROI。
二、从产品的生命周期来看:
1、产品发布前:负责参与并审核架构设计的合理性和可运维性,以确保在产品发布之后能高效稳定的运行。
2、产品发布阶段:负责用自动化的技术或者平台确保产品可以高效的发布上线,之后可以快速稳定迭代。
3、产品运行维护阶段:负责保障产品7*24H稳定运行,在此期间对出现的各种问题可以快速定位并解决;在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性。
参考资料来源:百度百科——运维工程师
一杯清茶NJ
系统维护工程师主要岗位职责有:
1. 参与ERP系统规划、建设,保障ERP系统运转正常。
2. 负责解决全公司员工ERP系统使用中遇到的问题,提供相关技术支持。
3. 数据库备份;
4 . 系统数据错误的处理;
5 . 对使用人员进行培训,指导其正确操作;
6. 协助完成公司员工桌面技术支持及办公网络维护。
系统维护工程师是指从事计算机系统的安装调试、运行管理与系统维护、故障诊断与故障排除、故障设备修复的技术人员。
扩展资料:
Linux系统维护工程师需要掌握的知识有:
1、Linux 系统基础⼊门-Linux的基础知识内容,和命令使用,以及用户和权限等核⼼知识点。
2、Linux 系统管理和进阶-Linux从进程、资源、任务、⽂件、软件包、磁盘等管理⽅法。
3、Linux 企业常用服务-企业级常用服务如DNS、FTP、Http、mail。
4、Linux 企业级安全原理和防范技巧以及网络和安全-Linux安全架构、安全威胁模型、以及加密、解密等原理,常见攻击和防范⼿段。
5、Shell 编程⼊门及进阶-Shell脚本基本用法以及进阶,从基础到精通,需要学习一些企业级常见脚本用法。
6、MySQL 应用原理及管理⼊门-Mysql安装、管理、授权、增删改查。
7、http 服务代理缓存加速-http ⾼级协议应用、缓存、web服务nginx。
8、企业级负载集群-企业级4层负载均衡LVS、和7层负载均衡nginx以及haproxy的应用。
9、企业级⾼可用集群-⾼可用集群原理,实现以keepalived为核⼼的⾼可用集群,以及主从高可用、双主。
10、运维监控zabbix-企业级监控体系以及zabbix流⾏开源监控系统的功用及架构。
11、云计算运维自动化-ansible、puppet等运维自动化解决方案。
12、WEB 服务体系架构-WEB服务体系架构,JSP体系、tomcat、CDN、缓存原理、压测、评估。
13、⼤型互联⽹集群架构和实战⽅案-LB集群:nginx、Haproxy、LVS HA集群、动静分离。
14、MySQL DBA 实战技能和优化-数据库参数优化、分库分表、备份方案、数据恢复策略、主从复制、读写分离、连接池及sharding技术、MHA等。
15、企业级云计算Openstack-Keystone、Glance、Nova核⼼组件、网络模块、块存储服务等。
16、企业级⼤数据Hadoop 运维实战-列式数据库HBase基础原理、安装配置及其应⽤、Zookeeper集群构建、hadoop实现Namenode⾼可⽤。
17、企业级虚拟化KVM 实战-KVM环境:KVM的安装、配置及应⽤。
18、NoSQL 企业级应用-Nosql 应用,如redis、MongoDB 复制、集群等⾼级应用。
19、虚拟化容器Docker-Linux 轻量虚拟化Docker ,Docker 的原理和安装,配置以及应用。
20、企业级K8S实战-组件功能、安装、配置、企业级应用场景和常见故障分析。
21、Linux 系统调优实战-从内存、CPU、进程调度、磁盘IO、⽹络参数等全面讲解Linux系统调优。
优质工程师考试问答知识库