baby梓瑜
运维工程师培训内容有电气安全知识讲解,现场认识变压器、中压配电柜、低压配电柜、UPS、EPS、蓄电池、精密列头柜,认识柴油发电机组,学习现场巡检工作的内容。
一、运维工程师简介
1、运维工程师(Operations),负责维护并确保整个服务的高可用性,同时不断优化系统架构提升部署效率、优化资源利用率提高整体的ROI。
2、运维工程师面对的最大挑战是大规模集群的管理问题,如何管理好几十万台服务器上的服务,同时保障服务的高可用性,是运维工程师面临的最大挑战。
二、运维工程师的工作内容
1、事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。
2、问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以及在系统出现异常的时候可以快速的发现问题和判断故障的影响。
3、问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。
4、问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。
小雨叫主子
首先这个要分运维级别来说了,比如初级运维工程师和高级运维工程师要掌握的基础技能就不一样。
初级运维工程师,需要掌握以下基本技能:
1、基础命令:
这个基础就包括:用户管理命令,文件管理命令,权限管理命令,软件包管理命令,vim命令,网络管理命令等。
2、基础服务:
企业常用的基础服务就包括DHCP,NTP,DNS,Nginx,Apache,Mysql,Redis,Vsftpd,Nfs。基础服务的掌握,相比命令稍微的难一点,但是同样有很多技巧。比如可以去各大视频站获取优质的免费视频学习。
3、自动化技能:
这个自动化就包括脚本自动化,需要熟悉掌握shell脚本或者Python脚本;包括监控自动化,不能靠传统的点击页面,查看进程来判断服务是否在线,需要熟悉掌握zabbix,Prometheus等主流监控软件;还包括工具自动化,需要掌握向ansible,puppet,Jenkins等自动化软件,实现服务的批量部署与业务的自动化。
4、安全:
作为运维工程师,首先就要时刻保障公司业务系统,服务器安全稳定运行。所以安全至关重要,主流的iptables,firewalld防火墙技术要熟练掌握,有必要的话常见的挖矿病毒,ddos等攻击有段也要有所了解。
中高运维工程师,需要掌握以下基本技能:
1、高可用技术:
业务比较复杂,用户群体比较大的企业,一般都会用到高可用技术,提升用户体验。那么主流的keepalived,heartbeat等是必须要熟练应用的。
2、虚拟化技术:
如果想达到高级运维工程师的水品,那么主流的虚拟化技术必须要掌握,并且不止于安装部署,还要有较强的故障排错和调优能力。目前主流的虚拟化技术有docker,k8s,kvm,OpenStack,Vmware ESXi,Xen等。
3、云架构:
除了熟悉虚拟化技术,还要有整合能力,比如如何将这个单个技术应用到实际生产,需要掌握切实可行的私有云,公有云网络架构技能。
4、应急能力:
除了技术性的技能,还要有遇事不乱,处变不惊的能力。对突发事件,能进行快速的分析,定位,并责任到人进行处理,有系统的进度与调度能力。
以上只是做了简单的阐述,在某些方面可能并不完善,欢迎大家讨论交流。
优质工程师考试问答知识库