运维是做什么的 运维工程师一天的日常都在做什么


1、服务监控技术:包括监控平台的研发、应用 , 服务监控准确性、实时性、全面性的保障 。
2、服务故障管理:包括服务的故障预案设计 , 预案的自动化执行 , 故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性 。
3、服务容量管理:测量服务的容量 , 规划服务的机房建设 , 扩容、迁移等工作 。
4、服务性能优化:从各个方向 , 包括网络优化、操作系统优化、应用优化、客户端优化等 , 提高服务的性能和响应速度 , 改善用户体验 。
5、服务全局流量调度:接入服务的流量 , 根据容量和服务状态在各个机房间分配流量 。
6、服务任务调度:服务的各种定时/非定时任务的调度触发及状态监控 。
【运维是做什么的 运维工程师一天的日常都在做什么】7、服务安全保障:包括服务的访问安全、防攻击、权限控制等 。
8、数据传输技术:包括p2p等各类传输技术的研发应用 , 也远距离大数据传输等问题的解决 。
9、服务自动发布部署:部署平台/工具的研发 , 及平台/工具的使用 , 做到安全、高效的发布服务 。
10、服务集群管理:包括服务的服务器管理、大规模集群管理等 。
11、服务成本优化:尽可能降低服务运行使用的资源 , 降低服务运行成本 。
12、数据库管理(DBA):通过设计、开发和管理高性能数据库集群 , 使数据库服务更稳定、更高效、更易于管理 。
13、平台化的开发:类docker和google borg平台的开发管理 , 及服务接入技术 。
14、分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入 。

    推荐阅读