运维DBA的四大纪律九项注意

朋友们调侃说 , 运维是个把脑袋别在裤腰带上的活 , 更有人说 , 运维是个把脑袋别在他人裤腰带上的活 , 苦劳没人认 , 有锅就有得背!
测试的同学说 , “吃瓜群众很难感知运维背后的付出 , 倒是出了事情更能体现我们的专业性 。”小样儿 , 你这是还没有掉坑里过 。
所以 , 最好就是减少锅的出现 。
但是 , 锅来了 , 大家就得背 , 甭管你是运维、产品、测试还是开发 , 总得有个人出来走一走 , 对吧?
今天我们就来谈谈运维 DBA 怎样少背锅 。
运维 DBA 的形势是很恶劣 , 但再恶劣也比不过当年红军过草地 。红军当年靠三大纪律八项注意度过了难关 , 若运维 DBA 认真执行 , 也能度过背锅难关 。
运维 DBA 的四大纪律
一、一切行动听指挥
甭管你是团队 , 还是团伙 , 要求都是一样的 , 一切行动听指挥!听谁的指挥?听运维经理、运维总监、CTO、CEO 的指挥 。
当年墨子当钜子的时候 , 手下 180 人 , 训练有素 , 同心同德 , “赴火蹈刃 , 死不还踵” 。这样的团队来搞运维 , 就具备了基本要求 。
运维团队里 , 最忌讳的是具有三脚猫功夫、蔑视前辈经验、心浮气躁的人 , 遇到这种人 Team要及时校正甚至剔除 , 否则这就是你背锅的最大来源 。我被坑得比较惨的几次 , 都是因为团队里有这样的人 , 想动手的时候不够坚决 , 最后祸起萧墙 , 只能弓着腰给客户和领导死命的批评 。这叫什么 , 一颗老鼠屎坏了一锅汤 。
所以 , 选择运维成员时 , 要选那种踏实、机敏、上进、沟通能力强的年轻人 , 用心培养 , 往往事半功倍 。
二、两条红线不能犯
所谓红线 , 就是天条 。第一个是按指挥再行动 , 其实是活的 , 可能是要请示和汇报的 。这第二条是死的 , 就像高压线一样 , 碰到就完蛋了 。
这一条其实是为了规避误操作 , 误操作就是人为故障 。人为故障在所有故障中的占比一直是很高的 。
这一条是为了规避 , 技术人爱钻牛角尖 , 看见故障钻进去就出不来 , 贻误战机 , 把快速恢复业务的大好时机给浪费了 。
三、假日前容量规划
记得某一年有一次团队  , 集合时某 DBA 睡眼惺忪地说半夜3点被告警搞起来了 。这还不算 , 他在玩密室逃脱的时候 , 又接到机房告警电话 , 某业务表空间使用率超过 85% 严重告警了 。是不是亮瞎了?

运维DBA的四大纪律九项注意

文章插图
要想轻轻松松过节日 , 或者出去玩 , 除了做好备份之外 , 最重要的是做好容量规划 。最基本的表空间、文件系统空间、历史告警等等基本情况横扫一遍 , 起码要能安全等到你休假回来 。
对于一些特别的电商系统 , 节假日可能正是高峰期 , 那就不仅仅是空间这点事了 , 还要做好性能预测和解决方案预案 。
四、备份恢复年年做
备份要做 , 恢复更要做 。如果你是管理者 , 千万不要以为你的 DBA 一定会帮你做了 。
不惊讶 , 以下是真实案例的脱敏数据: