那些刻骨铭心的误操作,我们到底该如何避免呢?

社区广播:运维派(Yunweipai.com)是国内最早成立的IT运维社区,欢迎大家投稿,让运维人不再孤寂的成长!

我最近在网上逛CSDN论坛“Linux系统管理”版块时,看到一篇发布于2008年标题为《写下你职业生涯中最难以忘怀的误操作》的帖子,该帖子截止本文写作时共有664条回复,在论坛里除了签到、踢楼、灌水贴之类的主题,能达到这个参与度可见该话题确实引起了大家的共鸣,虽然我在另外一篇文章中整理过几条危险可致命的误操作,但看了这个帖子里的文章后会发现他们的误操作是如此的相似。

我先说下自己的一次经历:曾经通过桌面共享的方式登陆到客户生产环境协助现场工程师解决某个功能不正常的问题(注意:仅仅是某个功能,软件状态还是RUNNING的),由于通过查看日志暂时分析不出原因,又急于恢复环境,就凭借经验直接对该软件执行了restart的操作,结果是我的经验判断是准确的,功能确实恢复正常了。但现场传来一句话“这是生产环境,有客户正在使用的,你这个restart是什么意思?有什么影响?”,当时愣住了,还好这个软件并不影响主要业务。。。所以,从那以后所有涉及业务重启的操作,都需要先征求现场的同意,不要把开发环境的作风带到生产环境。

下面我摘录了一些“精彩的”误操作,这其中是存在一些共性的,也是可以通过端正我们的操作习惯来避免的。
如果你也有过刻骨铭心的误操作,不妨和大家一起“分享”下。。。

marsaber:

我……
没完全关闭计算机,我拔光驱,把主板给烧了。

skylove:
ghost用得太多。。。有次在备份资料的时候,想偷懒用ghost搞定 (win平台,非热备份)。。。结果。。。结果。。。两块硬盘太象了。。

C.J:

编了两天两夜的 linux (第一次lfs), 做了个tar后, 删除原来的文件,发现tar解开出错。。。

xcrossbow:

07年底,想把一个img写到优盘时,用了如下糟糕的命令
dd if=./xxx.img of=/dev/sda
由于一直记得我的Thinkpad T43是并口硬盘,因该识别为 hda,自以为第一个优盘是sda了,打完后重启才意识到问题!
幸亏了解并用过sysrecue盘,参考以前看的linux server hack 2中的使用gpart恢复分区一节,找到了数据分区,救出了数据,好悬!

itxiaofei:

删除某变量路径下的目录,结果此变量为空
rm -rf $abc 实际就变成了 rm -rf /
从这以后,rm要带r都必须先确认目录,变量都必须判断一次

sanyork:

前年夏天管一个小的机房,机房里面有四个机架二十多台服务器,安装了两个空调,一个1.5匹的和一个5匹的,白天上班机房有中央空调,为了省电,白天只开1.5匹的,下班的时候忘记了开那个5匹的空调,结果1.5匹的那个空调由于负荷太大罢工了,后来机房里所有的服务器全部死机了,打开机房,里面温度有六十多度,不过那些IBM的服务器硬件质量还不错,所有的机器都发出报警声,没有造成硬件损坏,重新启动后就好了。

linxor:

可是不知道怎么的,那次要删除目录下的所有内容,本来要执行rm -rf ./*,却少输入了一个点,成了rm -rf /* 后果你是知道的!再也起不来了,连reboot都没有了,只有reset了!

Dalamar:

经常在十几台机器之间来回切换,有次rm -rf ./* 清个文件夹,结果执行完发现rm到其他机器上去了….
从此以后执行重要命令之前先ifconfig看下ip

feiwupiaoxue:

02年底刚到公司不久,给一位人事的漂亮妹妹重新安装win98,我用Ghost,结果人家安装了两个系统,我没有注意,一下子把系统文件等等都搞没有了,结果我圆了个慌,说系统坏了,文件也丢失了,我给她装好了。结果她谢了我,还请我米西一顿,成了我第一个女朋友,大半年后我们分了。一切不是我的错,呜呜!:(

注:我认为这小子是故意的~

hustwk:

有一天心血来潮,想把windows里的NTFS转换成为FAT32格式的。用魔法兔子的转换工具,警告说此功能尚不成熟,不保证能够转换成功。当时也没想就确认了,结果我的两个分区(特别是最后一个分区是备份数据的),全没了。搞了几天都无法恢复,积累了三年的资料毁于一旦,写了十几万字的自传也over了,哭啊哭啊,崩溃

tech_linux:

工作第一年,删除数据库表内数据. where条件后是ID=, 结果删到最后一个时走神, 没写id=,直接写了个数. 三秒钟,七百多万条数据被我删了. 当时全脑空白,后听同事说我脸色惨白!! 恢复一夜,还是丢失部分数据, 关键服务,核心数据库

ssffzz1:

大家还记得以前的昆腾大叫硬盘吧!
有一次修电脑,把硬盘的电路板朝上了。和一个同事在说话,没想到一个唾沫星子,掉线路板上,当时就冒烟了,赶紧断电。一看好像是一个元件都糊了。可是通电后,硬盘居然没事。
至今我也想不明白,元件都糊了,硬盘为啥没事。

linux小小白:

印象比较深的两次:一次在linux下,本来是ls某个目录,看到了该目录里的东西,那时想把里面全删掉(没用了),结果我以为是cd进去了,最后 #rm -rf * 半分钟后发现不对劲,ctrl+C,还是晚了,因为我是在/下,还好到时是在实验环境..还有次在windows,想在PE里重装下C盘,结果选错选项(from disk和from partition)最后整个硬盘被覆盖了,还好当时备份了分区表…

pp12416:

生产系统,为了测试冷备机,图省事,就直接把原来两台主服务器的网线拔掉了,没想到当时主服务器上面的集群马上就全部掉线了,当时吓得。。。。
还好重启后就恢复了,这事虽然没有造成什么影响,因为是很重要的生产系统,所以还是给我留下了很深刻的印象。
在此也提醒下各位同行,根据本人的经验,不论是windows还是linux,只要是带集群的系统,千万不要随意拔服务器的网线,因为基本上所有的集群资源都是监听IP的,如果网卡down了,结果可想而知。

feiyang1002:

亲历的事:一个同事执行tar任务,没有观察文件夹的大小直接执行tar 结果导致服务器马上宕机,事后查看该文件夹有20多G,当时负责服务器的同事脸色大变,主要是还是生产系统.,无数客户在访问。最后重启解决。

wonderone:

live的系统,history | grep reboot ,忘记输入grep了。。。

看完上面这些误操作后,你有何感想,是否和你曾经的经历非常的相似。。。写这篇文章不是为了笑话这些家伙,而是为了对这些案例进行总结提炼,以“负向改进”的方式来提升我们的经验,这些案例总结主要是下面两点值得我们牢记于心的:
1. 如果是生产环境,那么你的操作必须仔细,不要以为自己的技术牛,按照习惯性操作去处理。
2. 凡是涉及到破坏数据的操作(rm/dd/格式化之类),必须确认路径是否正确。

网友评论comments

发表评论

电子邮件地址不会被公开。 必填项已用*标注

  1. 公子说道:

    上次在一个群里面,一个闲的蛋疼的跟很多新人说你们执行下XXX命令(删格整个数据的),瞬间让人围攻而骂,太蛋疼了。误操作太。。。。

  2. sosolaris说道:

    我想起来曾经我写递归没判断,把iview某同事的C盘文件给删没了,哈哈。不是程序员这块料啊~~~

  3. […] 在系统运维过程中“Linux系统上常见的误操作”之首就是删除rm操作(特别是rm -rf),这些被误删的文件将无法被取回,那么是否有办法解决这个问题呢?目前有两种解决方案: […]

Copyright © 2012-2017 YUNWEIPAI.COM - 运维派 - 粤ICP备14090526号-3
扫二维码
扫二维码
返回顶部