岗位职责
1、管理服务器集群,保障服务稳定安全可用
2、管理和配置软硬件的监控,对业务数据进行日常监控和分析
3、负责系统的部署、发布、监控、预案和优化等
4、及时发现系统运行中的隐患,并提出合理化调优建议或扩容建议,保障系统安全高效运行
5、自动化构建部署系统、监控报警等自动化运维
6、熟悉并掌握公司业务平台的运作流程,处理业务和技术边缘问题
7、积累并规范化系统运维最佳实践并文档化,探索、研究新的运维技术方向
任职要求
1、本科及以上学历,3年以上大中型在线系统运维工作经验
2、熟练掌握shell
3、熟悉Web相关技术,Tomcat、Nginx 等应用的管理、配置及优化
4、熟练掌握HAporxy、LVS等负载均衡软件的原理及配置
5、熟练掌握KVM/VMWARE/XEN等虚拟化软件的使用
6、熟悉zabbix、nagios、cacti、ganglia等常用监控报警系统
7、熟悉配置管理工具(如SaltStack/Puppet)
8、有过自动化运维的经验,如Webistrano,Capistrano,Controltier的使用
9、能够熟练排查运维过程中出现的服务故障、系统故障、网络故障
10、较强的沟通、协调、理解能力和良好的责任心和团队合作能力