Feb 262010
就一个大环境来说,找几个新人凑合一下就能跑起来,如果有经验的同学愿意出力,倒也会跑的稳定。如果是30台主机超过30天的无法服务而无人得知,不算重大故障,那么核心服务的数个小时异常就不值得一提了,全年也就不会有重大事故了。
不牢骚了,整理下2010年的工作计划,共以后参考。
1,完善各种流程。确定下来的操作方式需要督促 team player 遵守。不当之处及时调整。
比如,硬件异常时如何处理合适。Wiki文档,日常工作中容易遗漏的调整需求,程序缺陷跟进等。
(可能会用到 “Any updates?”, “If you need any help, please let me know”, “Reassign it to XX instead please” )
2,修复各种基础设施。包括虚拟平台,代码仓库,验证方式的调整等。
在处理之前务必在周会上提出来,讨论确认。
3,操作流程上的优化。简化日常工作的步骤,player 应有更多的空闲时间去关注自己感兴趣的技术。
可能需要写脚本,简化日常的重复操作。对非核心任务的内容,不应花大量时间处理。