我正在寻找有关您遇到的系统管理员事故的有趣故事。删除CEO的电子邮件,格式化错误的硬盘等。

我将添加自己的故事作为答案。

评论

另请参阅serverfault.com/questions/5066

这确实是一个民意测验,然后是一个问题。这可能应该设置为社区Wiki。

是的,这绝对应该是社区Wiki。不过,就这个问题而言,我最喜欢的故事是500英里的电子邮件之一-ibiblio.org/harris/500milemail.html-尽管显然不是我。

500英里真是太好了

这应该称为“更严重的系统管理员事故”。

#1 楼

我发现linux“ killall”命令(杀死与指定名称匹配的所有进程,对于停止僵尸很有用)和solaris“ killall”命令(杀死所有进程并停止系统,对于停止生产服务器非常有用)之间的区别很有趣。高峰时段,让所有同事嘲笑您一周)。

评论


去过也做过。之后,我们在solaris-box上使用了killall-command别名:alias killall ='echo ORLLY?' =)

–指挥官基恩
09年5月28日在12:03

在Solaris上,“ ifconfig -a4”(显示所有接口的IPv4信息)和“ ifconfig -a 4”(将所有接口设置为0.0.0.4)之间还有一个重要区别。

–桑切伊
09年7月19日在7:28

+1“哎呀,这风登录到了solaris吗?”

–马克·哈里森(Mark Harrison)
09年7月21日在0:30

@Commander,我要对您的评论进行投票,但此刻恰好有42票投票...我只是不能。

–马西莫
2010年7月29日在18:42

另外,Linux上的主机名-f将在Linux上打印标准域名。在Solaris上,它将主机名设置为-f。

– 200_success
2010-10-14 19:11

#2 楼

我负责我们的公司Web代理,当时是Netscape的产品。在管理表单中玩耍时(这是一个基于Web的界面),有一个很大的按钮(我发誓是红色的),上面写着Delete User Database。没问题,我想。让我们看看当我点击它时给我的选择是什么。如果没有选项,肯定会出现确认提示。

是的,没有确认。没有选择。没有更多的用户。

因此,请Solaris Sysadmin先生说,我非常需要从磁带还原,他回答说:“我不备份那个盒子。

“呃,再来一次,”我反驳说。

“我不备份该框。它在我要添加到备份循环中的清单上,但是我还没有解决它。“

”该服务器已经投入生产了将近8个月!我尖叫。

耸耸肩,他回答。 “抱歉。”

评论


对于所有抱怨那些讨厌的人的人来说,这绝对是一个故事。对话;)

– MikeyB
09年5月13日在20:24

我不太确定你是不是应该对他大喊大叫...

– Mikeage
09年5月14日上午11:10

这并不是真正的意外-您有意按下Delete User Database按钮,伙计...

–Wayne Koorts
09年6月20日在23:07

是啊,你说得对。按下按钮并非偶然。实际上删除数据库是偶然的部分。随你...

–squillman
09年6月21日在3:30

该按钮后应该有两个或三个确认提示。删除用户数据库有什么有用的功能?我完全怪罪把按钮放在那里的程序员。数据库没有备份的事实。 “天才也许有其局限性,但是愚蠢并没有因此而受到阻碍。” (向Elbert Hubbard致意)。假设人类并不好奇,那么粗心的猿猴只会造成灾难。

–杰瑞德·厄普迪克(Jared Updike)
09年8月26日在17:44

#3 楼

很多年前,我工作的公司有一个客户端,该客户端每晚将其NT 4.0 Server备份到Jaz驱动器(例如大容量zip磁盘)中。

我们设置了一个批处理文件,该文件作为计划的工作在一夜之间运行。每天早上,他们从驱动器中收集昨晚的磁盘,然后在晚上离开之前,先按顺序插入下一个磁盘。

无论如何,批处理文件看起来像这样( Jaz驱动器是驱动器F:)...

@echo off
F:
deltree /y *.*
xcopy <important files> F:


无论如何,有一天晚上,他们忘记将磁盘放入。驱动器F的更改:失败(没有磁盘驱动器),然后批处理文件继续运行。批处理文件的默认工作目录? C:。我第一次见过备份例程会破坏正在备份的服务器。

那天我学到了一些有关sysadmining(和异常处理)的知识。

Jim 。

PS:解决方法? “ deltree / y F:\ *。*”。

评论


...我们必须解释一下Jaz驱动器是什么?我真的那么老吗?

– Spencer Ruport
09年5月14日,0:54

这是IOMEGA的东西(还记得Zip Drives吗?)是Zip Drives的老大哥,它就像没有头的硬盘,只是盘片,放在带有小窗口的塑料盒中,当插入时驱动器,驱动器将标题插入其中。像1GB或2GB一样昂贵,并且容易过热,因此不建议将盒带留在读取器中(这是IOMEGA的一位老老板说的)

–安道尔
09年5月14日上午11:29

嘿,我喜欢通过与死而无关的zip驱动器进行比较来解释jaz驱动器。

–卢克
2009年6月9日19:51

如果让您感到年纪大一些,有些系统管理员以前从未见过deltree。

–约瑟夫
09年6月20日在16:17

我不得不向很多程序员解释说,当您尝试更改状态的操作但可能会失败并使您保持先前的状态时,如果要执行危险的操作,则必须检查该操作是否成功您应该处于以前的状态。为什么我要解释一下?

– carlito
09年6月29日在22:49

#4 楼

root @ dbhost#find / -name core -exec rm -f {} \;

我:“您不能进入?确定。数据库名称是什么?”

铜:“核心”。

我:“哦。”

评论


从那时起,将'file'命令的使用添加到了清理crontab ... :)

– MikeyB
09年5月31日下午4:14

哦,亲爱的上帝。

–squillman
09年5月31日下午4:33

哦,天哪!我将对此做一个心理记录,所以我从不这样做。

– Glenn Willen
09年7月16日在22:23

#5 楼

我喜欢每个人都以“我年轻/绿色的时候”来证明自己的故事的方式,就像他们永远不会再做那样。即使是经验最丰富的职业人士也可能发生事故。

我自己最糟糕的时刻太糟糕了,我仍然感到沮丧...

我们有一个存储生产数据的SAN。对公司至关重要。我的“导师”决定扩展分区以释放一些磁盘空间。您能看到前进的方向吗?他说,SAN软件可以在生产时间内实时完成此工作,没有人会注意到。警钟应该已经响起,但明显没有声音。他说他已经做到了“之前很多次”,没有问题。但这就是问题-他让我点击了“您确定吗?”按钮!当我刚进入公司时,我以为这个家伙知道他在说什么。大错。好消息是LUN扩展了。坏消息是...好吧,我知道当我开始在Windows盒子上看到磁盘写入错误时,就有一个坏消息。

很高兴我穿着棕色裤子。

我们不得不解释为什么午餐时间1TB的数据消失了。那真的是非常非常糟糕的一天。

实际上,这是一个好原则-在做您怀疑的事情之前,想象一下如果发生问题必须向管理层解释。如果您想不出一个好的答案来解释自己的行为,那就不要这样做。

评论


上一段+1-“坐在您的手上”技术,一分钟的反思时间

–安迪
09年6月6日在21:02

在使用实时系统一段时间后,您将获得一定的技能:对什么是危险和什么不是危险的一种蜘蛛感。就像在根提示符下按return之前暂停一秒钟,或者确保SQL update语句具有适当的where子句(该子句已经在select count(*)中运行)一样。

– jplindstrom
09-9-09 at 16:47

我想要一个弹出窗口,上面写着“您要继续之前打印简历吗?” ..并且只有一个选项:“是”

–沃伦
2010-6-14 17:57

+1为最后一段中的建议

– Jeroen Huinink
2010-6-25 at 11:40

+1,同上我记得一位系统管理员朋友曾听说他的年度表现评估中存在打字速度不佳的问题,他轻蔑地(正确地)驳回了这一说法,他说:“我没有付快速打字的费用。缓慢而周到。”。

– MadHatter
2011年9月9日在8:23



#6 楼

当营业时间开始说Nagios无法连接到非关键服务器时,Nagios对我们进行了ping操作。好的,爬到服务器机房。这是一台旧服务器,是在02年购买的Dell 1650,我们知道1650一直存在硬件问题。 PFY按下电源按钮。没有。再次击中它并保持五秒钟以“强制打开电源”……这将覆盖BMC的错误保护,因为如果没有DRAC,就无法在不打开机箱电源的情况下检查BMC日志。

机器启动POST,然后再次死机。我站在上面,走了,“我闻到烟味。”我们将服务器从其导轨上拉出,其中一个电源感觉很热,因此PFY将其拉出并准备将箱子重新盖好。我说:“不,这不是电源烟雾,是主板烟雾。”

我们再次打开盒子,寻找燃烧气味的来源。结果是电感线圈和电容器从主板上的稳压器吹出,然后在所有物体上喷上熔融的铜和电容器胶,使一堆东西短路,基本上造成了很大的混乱。

对我来说,最糟糕的是认识到我抽了足够多的硬件来识别被烧主板和被烧电源气味之间的差异。

评论


这项工作的选择标准包括:良好的嗅觉。辉煌。

– mlp
09年7月7日在22:43

我的好友将一组驱动器导轨拧入了磁盘,直到它们进入电路板并将其短路。漂亮的粉红色烟雾。非常有特色。

–squillman
09年8月20日在2:54

#7 楼

三天前(严重),我远程登录到学校服务器,在Windows Server 2008文件服务器上安装Service Pack2。

我决定将所需的重新启动安排在深夜,那时老师不会在他们的年终报告卡上完成登录。我输入的内容如下:

 at 23:59 "shutdown -r -t 0" 


...可能效果很好。

但是我第二次猜到了自己。我的“关机”语法正确吗?我尝试通过键入

 shutdown /h 


...查看使用帮助,但立即失去了RDP连接。惊慌失措,我用谷歌搜索语法。快速搜索显示,Server 2008版本的关机包含/ h开关,(您可能已经猜到了)它使计算机进入休眠状态。

老师在几分钟之内开始打电话给我,报告他们不再打开或保存他们一直在处理的报告卡。由于我不在现场并且服务器室被锁定,因此我不得不直接打电话给学校校长,并带领她完成重新启动机器的过程。

今天,我以各种形式带给大家自制饼干道歉。

评论


命令行中有缺陷的用户界面设计的一个完美示例:“最不惊奇的原理”发生了什么?

–美
09年6月17日在23:06

在DOS / Windows上不是吗?

–杰瑞德·厄普迪克(Jared Updike)
09年8月26日在17:52

通常是/?在Win上,但是有很多从UNIX移植或由UNIX人员编写的实用程序(包括很多在MS上的实用程序),它们是-h或/ h

–理查德·加兹登(Richard Gadsden)
2009年10月9日14:17

..但您仍然可以尝试使用/?第一!

–沃伦
2010-6-14 18:01

这就是为什么我喜欢Linux。男子关机。我知道我不会给男人带来麻烦!

–乔什
2010-10-13 23:01

#8 楼

在上一份工作中,我们有一个出色的本地系统,该系统可以记录并存档进入,离开或留在公司内部的每一封邮件。

删除整个邮箱?没问题!寻找某人一周/一个月/一年前发送给您的邮件,但您不记得是谁发送的或主题是什么?没问题!我们将把2月份的所有邮件重新分发到一个特殊的文件夹中。

有时,公司首席执行官需要监视在竞争对手和内部销售人员之间的邮件。因此,我们设置了一个脚本,而不是每天晚上运行,并将前一天的相关邮件发送给CEO。没问题!

大约一个月后,一个双重的紧急问题的声音从高处降下来。似乎首席执行官在阅读发送到$ OTHERCOMPANY的邮件列表时,遇到了以下邮件:

To: somebody@$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)


自然,首席执行官是重要人物,所有人,他太忙了,无法在Outlook中单击所有这些“发送已读回执”对话框,并且已将其客户端配置为仅发送所有这些。监视过滤器捕获的消息之一具有已设置的读取-接收请求。猜猜Outlook是做什么的?

我们的下一个任务是:在邮件过滤器中添加规则,以阻止CEO向该公司发送的已读回执。是的,这是最简单的方法。 :)

评论


但是在我的国家这是不合法的。完全没有

–马夫
2010-6-1 10:32



啊,那是你的国家。 :)在加拿大,就可以了。

– MikeyB
2010年6月9日18:17

监视进入或离开您自己公司服务器的电子邮件是不合法的吗?你生活在哪个国家?

–安德鲁·恩斯利(Andrew Ensley)
2010-10-29在0:10

+1新闻报道

–法哈德·萨达(Fahad Sadah)
2010-12-19 13:18

#9 楼

我的是大约10年前,那时我还没弄湿。我很高兴在所有程序员计算机上安装备用电池。他们还希望加载该软件以警告停电并正确关闭。

因此,我在计算机上进行了设置,以首先测试所有内容并确保一切正常。因此,我断开了电源线,屏幕上出现了该消息。 “外部电源中断,开始系统关闭”。

所以我想,嘿,很有效。但是出于某种奇怪的原因,我什至不记得了,它以网络消息的形式发送了该消息,因此公司中的所有200多台计算机都收到了该消息,其中有100多个用户是程序员。

是的,谈论大规模的怪胎!

我在那个地方低头了一段时间!

评论


哈哈,听起来像是我的一个朋友在这里发生的“网络发送”事件,大约有1300名收件人:)

–squillman
09年5月13日在20:17

啊。我也在大学里做了“网络发送”的事情。我以为“他们必须禁用此功能”! -!在整个实验室中,计算机发出了消息。我决定向网络管理员道歉,在途中,我通过的每台计算机都收到了该消息。 /叹

–马特·西蒙斯(Matt Simmons)
09年5月28日在18:19

是的,走到那里丢脸!我的朋友没有离开他的椅子。也没有打扰他的电话。

–squillman
09年6月12日在15:29

我的一个网友哈哈(Haha),我的一个网友向学校里的每个人发送了“帮助!我被困在114室”,当然60秒后,一小群人出现了,找出了谁发了信息

–马克·亨德森(Mark Henderson)
09年6月21日在5:12

实际上,我们是在大三时使用该功能来对系统管理员进行朋克的。使用伪造的AV消息和看起来像来自他的系统关闭消息清除了所有计算机实验室。他强烈怀疑我们是罪魁祸首,但我和我的好友各有一个不在场证明(我在上课时发送了第一个,在我上课时他发送了第二个),并且计算机上有通用的实验室登录信息

– Shial
09年8月18日在13:08

#10 楼

我经常在Solaris机器上使用“ sys-unconfig”命令来重置机器名称服务I.P。地址和root密码。我在用户系统上,登录到建筑物安装服务器并以root用户身份进行查找,然后忘记了我已登录另一台计算机(非描述性的“#”提示),然后运行了“ sys-unconfig”命令。

# sys-unconfig     
        WARNING

This program will unconfigure your system.  It will cause it
to revert to a "blank" system - it will not have a name or know
about other systems or networks.

This program will also halt the system.

Do you want to continue (y/n) ? y

Connection closed

#


该“连接已关闭”消息慢慢变成了紧急情况...运行该命令时我登录的计算机。

最糟糕的部分不是我的同事给我带来的困难,而是一个月后我做了同样的事情。

评论


哦,经典的“我在哪台机器上?”恐慌的时刻。我去过那儿。我感到你很痛苦。

– sysadmin1138♦
09年5月19日在17:35

我也是。任何经历过的人都完全知道“冰冷血”这个词是什么意思。

–马特·西蒙斯(Matt Simmons)
09年5月28日在18:23

我的shell提示总是包含用户名和主机名是有原因的...

–德罗伯特
09年5月5日在17:35

我曾经设置别名以登录到不同的计算机,以获取不同的彩色背景,从而能够更清楚地识别我所在的计算机。

– Zitrax
09年6月11日在22:10

当我在服务器和本地计算机上都使用Linux时,我经常在服务器和PC上打开root提示,服务器上有红色的提示用于区分

–休伯特·卡里奥(Hubert Kario)
2010-10-5 20:28

#11 楼

我有一个很好的。诚然,这是我作为系统管理员之前的经历,但仍与技术有关,因此我想添加它。美国空军。我刚从技术学校毕业,后来发现自己定居在韩国。到达车站后不久,一个机会就出现了,与曾在这里住了一段时间并实际在某些实际(即“生产”)设备上工作的“大家伙”一起向南行驶。

我和机组人员一起摔倒了,作为一个急切的年轻技术,他感到不胜其烦,对将我的手拿到能够传递实时军事语音和数据流量的实际设备的前景感到非常兴奋。

为了让我慢慢起步,他们递给我一本手册,转到预防性维护部分,向我指出了四个装有几个大型数字多路复用器的机架的方向。这些设备非常简单,我们在技术学校学习了相同的设备。

阅读手册的第一页; “为数字多路复用器通电。将两个后部开关都转到ON位置,等待设备加电,然后开始测试。”我抬起头,已经有了力量!

我肯定陷入了困境。不知道如何进行,我尽了最大的努力,“嗯。金达迷失在这里了”看着大四学生。

他看着我笑着,“不,不,可以。你可以忽略清单的那部分。”然后,当他注意到我脸上的表情时(由于我们在学校里教过NEVER,所以永远不要忽略清单的任何部分,如果这样做一定会导致死亡和破坏),他认真看了看自己的脸。面对,说:“只剩下那一部分!跟随其余部分,直到写信!”

有幸地,我经历了多步的PM指示,作为蛤lam而高兴,并为他们为让如此低级的(尽管很聪明)技术来完成这项重要工作。

在这些大型多路复用器的第五和第六次预防性维护清单之间的某个地方,我开始注意到我周围的活动水平有所提高。电话在响,人们在迅速移动。最后,一群人朝我跑来,由一位使我失望的高级技术人员率领。

“嘿!我们“正在看到大量的数据流量中断,我们已经隔离/跟踪了您正在使用的机架的路径!您是否发现任何奇怪的东西。”

(那时他被另一位疑难解答人员切断,后者将我转到执行PM的第一组多路复用器。)

“ HONT NUTS!它们被关闭了!他已经把它们关掉了!!!!!“”

很快,我看着他们匆匆跑过手册的第一步,“将两个后部开关都转到ON位置...”高级技术完成了,他走了过来,通过关闭关键设备关闭了我的想法。

出于机智,我递给他清单一直在追随,发誓我并没有偏离一切。我按照他的指示去写信了。

过了一会,他笑了起来,指出问题出在哪里。

在手册中,预防性维护清单中的“最后”步骤是:

“记录最终的探头读数,擦拭前面板,清除所有灰尘和微粒,然后
将两个后部电源开关都转到OFF位置。 “

:)

评论


我现在不知道这意味着什么

–乔·菲利普斯(Joe Phillips)
10-10-16在5:24

最后一步说要关闭机器电源,这看起来有点奇怪吗?就是想。

–安德鲁·恩斯利(Andrew Ensley)
10-10-29在0:19



看起来确实有些奇怪,但请记住,他曾在军队中服役。想象一下要指挥一支军队,每个士兵都说:“等等,你确定吗?这个命令对我来说听起来很可笑。”

– Kyralessa
2010-12-11在2:54

#12 楼

这是一种系统管理员事故。.就系统管理员而言,偶尔不得不从A点到B点之间物理地拖运大量机器(其中A和B似乎总是在没有电梯的建筑物中被数个楼梯隔开)。在一天的第n次旅行中,我停了下来,从地下室的载物水平上飞了三个航班,与坠落的人聊天,支撑着我正站在空旷的楼梯间内部扶手上的全尺寸塔架/站而且...好吧,你猜到了...我对此失去了把握。它毫不费力地直接向下钻入井中,当到达底部时,呃……与其说是那个功能,不如说是!可维修的部件总数:两根RAM,一张软盘驱动器和一张ISDN卡(上帝保佑Hermstedt工程人员!)。其他所有东西都破裂,嘎嘎作响或粉碎成小块。

靠着上帝的恩典,没有人在下面走,但值得庆幸的是,这是我上司的第一任,所以我必须继续工作。感觉非常恶心一个小时左右。

道德:重力总是赢!

评论


您没有拍下残骸的照片,对吗?

–巴勃罗
09年5月28日在11:13

@ J.Pablo-不,我担心这是十年前的事,当时相机很大,里面装有化学物质。如果我最近做过这件事,那么我会在十分钟之内在YouTube上完成工作!

–avstrallen
09年5月28日上午11:29

真实的故事:这发生在9年前的我身上,但那是在9层窗户的空调上。这不是我的错(我只是在帮助一个人),没有人受伤,但是好几天我都感到不适。

–imgx64
2012年1月1日5:31



#13 楼

我正在为某人重新加载系统,在手动备份过程中,我问他一个问题:“您还使用其他程序吗?”和“您在计算机上还有其他重要的事情吗?”

他多次说“否”。

我被说服并格式化了该驱动器。

大约30分钟后,他说“哦,我的天哪”,双手放在头上。

原来,他已经在一个专门程序中从事了10多年的书本写作工作。这是当程序用来将用户数据保存在程序文件目录中的时候,我想念它了。

哇哦。

他并不生我的气,但那是一个清醒的感觉。

评论


您已经教给他一个宝贵的教训:备份很重要

– MikeyB
09年9月10日在5:00

只是读这真的很痛。如此痛苦。当然可以,但是...

–马夫
2010年6月1日上午10:36

对于那个可怜的家伙来说仍然是一个很好的经历。他可能已经工作了30年,并且在您的面前心脏病发作。

–halp
2010年8月8日,11:56

男人,我记得做过类似的事情。显然,我叔叔在他的工作给他的这个定制Windows accouting应用程序中有很多类似clientelle的东西。它在程序文件/ sigh中。幸运的是,当我修理爸爸的工作电脑时,我记得它,上面有一些定制的保险应用程序。

– PHGamer
2010-10-16 3:50



@phgamer,我可以请您看您的语言吗?抱歉,这不是那种地方。

–Chopper3
2010-10-29 13:06

#14 楼

我个人最喜欢的不是我的,我对此感到非常高兴。在这里看看。

评论


哇。那很棒!

–克林顿·布莱克莫尔
2009年6月5日在16:01

#15 楼

这不是我发生的事情,但是...

我在一家公司工作,该公司生产的软件可以在客户端提供的Linux机器上运行。实际上,我们将“接管”机器,将其完全配置为符合我们的规格,并进行所有管理和监视。本质上,我们是一个由10至15个系统管理员组成的团队,为数百个客户管理数千个服务器。错误肯定会发生。

我们的一个团队发现了服务器上的一些问题(我认为是备份),并决定他应该在该服务器上运行fsck。他停止了所有相关服务,确保系统最近进行了备份,然后运行fsck,但它抱怨文件系统已安装。由于我们是远程的并且没有远程访问权限(DRAC,ILO等),因此他无法执行fsck,但是如果您小心翼翼,他非常确定在安装了文件系统的情况下这样做是安全的。

他决定通过在根分区上运行fsck来自己尝试,结果可预期–他损坏了根分区,无法再启动。

困惑,他走了过去,与我们的团队负责人交谈。负责人说,他非常确定您无法做到这一点,团队成员说:“您一定可以!”,拿起了负责人的键盘,并告诉他您可以–通过在负责人的根分区上运行fsck。哪个完全损坏的HIS根分区。

最终结果是什么?由于团队成员的测试,没有丢失任何客户数据。员工的工作效率损失了两天,但价值却远远低于客户机器上的数据。并作记录?您可以在已安装的驱动器上运行fsck,但只能用于验证数据。不修。那是团队成员的错误。

-

要添加我自己的故事,我在同一家公司工作,并试图重置用户密码。我们的系统拒绝让我将其设置为他所需的密码,因为它跟踪了旧的密码哈希,并拒绝让您重复该密码。该机制很简单:它针对数据库中的最新哈希值验证了密码。

(出于记录的原因,它必须是旧密码,因为它是一个共享帐户,并确保每个人都知道新密码不切实际)

我决定只是进入用户数据库并删除新记录,以便使用较旧的记录。全部都是SQL(运行Sybase的旧版本),因此很容易。首先,我必须找到记录:

SELECT * FROM users_passwords WHERE username='someuser';


我找到了他想保留的旧记录;前面还有两个。我决定要聪明一些,只删除比旧唱片新的东西。查看结果集,我发现数据库中的旧密码为ID#28,而新密码为ID#数千(非常繁忙的系统)。很简单,所有旧行都大于28,所以:

DELETE FROM users_passwords WHERE id > 28;


没有什么比做一些简单的行修剪并看到'212,500行受影响'更糟糕的了。幸运的是,我们有两个主数据库服务器(具有用户ID),但是Sybase(至少是我们的版本)不支持自动复制,因此它不会自动清除旧记录。转储users_passwords表并重新导入它是一件微不足道的事情。不过,还有一个很大的“哦,天哪!”时刻。

评论


这就是为什么sql中有一个“ LIMIT”语句;)

– Hayalci
09年5月28日23:56

更重要的是,这就是为什么您总是总是首先发出“ DELETE FROM xxx”作为“ SELECT * FROM xxx”的原因。然后再次检查显示的内容,然后将SELECT *替换为DELETE。

–sleske
09年5月29日在1:11

仅供参考,我不确定即使没有更改的fsck在挂载的ext3上是否安全,毕竟它会执行日志重播...

–德罗伯特
09年5月5日在17:41

不,这就是为什么您总是总是先发出begin tran。然后,当您看到受影响的行比预期的多时,可以发出回滚。

– pipTheGeek
09年5月5日在18:13

@Dan与其他任何RDBMS几乎相同,只需确保运行语句,已计划好检查,例如仅检查受影响的行或选择检查更新结果,然后提交或回滚即可。当我忘记在MS-SQL 2005的T-SQL语句中突出显示WHERE子句时,它为我节省了一次。

– pipTheGeek
09年6月8日在18:51

#16 楼

我最喜欢的另一个:

在系统上安装计算机和本地激光打印机时,我有个绝妙的主意将它们都插入计算机的UPS中。您是否曾尝试将其插入台式机UPS中以打印到本地激光打印机?好吧,如果您不知道,它往往会拉动所有放大器...这将重新启动计算机...并且打印作业将永远无法完成...!

每次都能接到电话:每当我打印时,它都会重新启动计算机,并且不打印!!!'?

糟糕!

JFV

评论


噢,我只是等着看现在在我教堂里发生:)

–squillman
09年5月31日下午4:34

大多数UPS制造商说“不要插入激光打印机”,因为它们会使它们过载。

–安德鲁(Andrew)
2010年7月23日在7:01

#17 楼

客户的实时顾客数据库上的不带WHERE子句的DELETE语句。

评论


“开始交易” FTW!

–spoulson
09年9月1日于17:03

在我销毁他们的实时数据库之前,您在哪里?

–伊恩·博伊德(Ian Boyd)
09-09-2 14:53

那是一种通过仪式;每个刚起步的DBA至少必须这样做一次。希望在不太重要的事情上...

– RainyRat
09年11月5日在12:22

#18 楼

键入kill 1作为root。 init和她所有的孩子都死了。和他们所有的孩子。等等。哎呀。

我要打的是kill %1

当我意识到我要做什么之后,我跑到了BIG羊毛分拣机的控制面板上,然后打了一下。紧急停止按钮。
由于我刚刚杀死了控制它的软件,所以这停止了机器的运转。

评论


那个让我发笑!过去在大型机器上工作过,我可以使用控制系统。

–SpaceManSpiff
09年6月21日在0:12

在BSD上,kill -1 1导致init重新读取inittab或/ etc / ttys。离开“减号”会产生后果。

–kmarsh
09年7月15日在17:53

谢天谢地,那个急停按钮! :-)

–staticsan
09年8月24日在23:23

+1之所以不能说“您不能通过混搭软件来造成任何硬件损坏”,表示+1。

– outis
2011年8月31日13:02

#19 楼

在我职业生涯中的某个时候,我所在的公司进行了法律调查,要求我们从“今天”开始一直保留所有电子邮件,除非另行通知。在每天存储了交换环境的每日完整备份(每晚1TB)之后,我们开始出现空间不足的情况。

交换管理员建议我们仅保留每8封电子邮件。为此,我们让他们还原了一天的交易数据库,提取了他们需要的电子邮件(已标记要调查的特定人员)并重新存档。他们每隔8天发送一次电子邮件来备份所有备份。选择第8天是因为交换具有参数集,其中“已删除项目”在数据库中保留8天。

完成每个存档后,我将回顾并删除所有早于其存档的备份。

TSM没有简便的方法因此,您必须手动从备份数据库中删除对象。

我编写了一个脚本,该脚本将通过使用今天与当前日期之间的差值进行日期计算来删除所有早于某个日期的备份。有问题的日期。有一天,我不得不删除大约一个月的备份,除了进行日期计算时,我打了一个错字,输入日期为7/10/2007而不是6/10/2007,然后运行了脚本。我意外删除了整整一个月的数据,这是非常重要的诉讼的一部分。

之后,我向脚本添加了一些步骤,以确认您要删除数据并显示您将要删除的内容...

幸运的是,他们甚至从未使用过我们努力保存的任何数据,而我仍然有工作。

评论


每天1 TB的Exchange数据?哇-你们有365 TB专用于额外的Exchange备份吗?那是您需要去的一些严肃的存储空间。

–卡尔C
09年6月20日在17:17

如果您去过欧洲,您只会损失1天:-)

– PowerApp101
09年8月5日在6:04

#20 楼

经过漫长的一天或性能跟踪并调整了大型主机(您知道野兽花了几个小时才能使所有备用备份站点都同意确实重新启动并完全同步了),我伸出了手指,键入了满意的关闭提示-p现在在我的笔记本电脑提示符中,合上盖子,将串行电缆从主机上拉出,这是因为期待有一个更大的冷玻璃杯。

突然我听到了旋转主机的震耳欲聋的声音。当我的笔记本电脑仍然快乐地显示X时。

在等待计算机再次完全联机时,我决定我有时间让我的ACPI在笔记本电脑上工作,所以我从来没有想过要关闭CLI我的笔记本电脑。

评论


如果向下旋转大型机会发出很大的噪音,我不想听到它向上旋转,或者更糟的是全速旋转。

–迈尔奇亚(Mircea Chirea)
2010年7月6日23:04

#21 楼

我们正处于停电之中,发现UPS以配置负载的112%运行。当时我们在发电机上运行,​​这不是什么大问题。

因此,我们四处拉动备用电源电缆以减少该UPS的电源使用(我们有两个,一个比其他更大)。我们到了运行服务器机房的网络交换机(这是该服务器机房,其中包含公司的所有内部服务器,而客户面对的服务器位于另一个服务器机房中)。该交换机是大型企业级交换机,其中装有三个电源。电源是N + 1,所以我们只需要两个电源就可以运行交换机。

我们选择了一根电缆并将其拔出。对于我们来说不幸的是,另外两个电源插头插入了一个电源板,当负载增加到插入的两个电源上时,该电源板迅速爆裂。然后,系统管理员惊慌失措并插入了第三根电缆。交换机试图启动,将交换机的全部负载分配给了单个电源。它没有关闭电源,而是在距离我不到12英寸的火花中爆炸,使我跳回到服务器机架中。

出于本能,我试图跳到侧面,但是不幸的是我的左边是一堵墙,我的右边有两个是一个6'4“的大型设施人员。我有些设法跳过了他,或者可能是通过他从Compaq机架上跳下来(网眼薄的那些)正面),而无需将整个装置放在机架上,也无需触摸设施人员。

评论


+1代表了惊人的飞跃。

– RainyRat
09年6月23日在14:48

谢谢。我没有把他打倒的事实给设施人员丹尼斯留下了深刻的印象。

–mrdenny
09年6月24日在4:27

#22 楼

这次事故没有发生……但是值得一提:

我被送到一个经常使用的数据中心,对新电路进行带宽测试。我到达了分界室/ IDF,在我的测试路由器的一个机架上找到一个位置,进行了连接,然后开始了测试。不幸的是,我完全没有注意到生产中的边界路由器不仅完全在下一机架上(几乎处于同一水平),而且与我的测试路由器具有相同的品牌和型号。

测试完成后,我开始将电源开关按到关闭位置(...以慢动作想象...),我发誓,正当我施加压力时,它突然将我发现路由器即将关闭的是生产中的那个。我的心停了下来,我几乎...好吧,用你的想象力。

我离开了数据中心的MDF,看上去吓坏了,脸色发白,但与此同时,我仍然有一份工作很高兴!

评论


试想一下,这可能是那些地雷的情况之一。您意识到手指按下按钮已完成的操作,并且无法松开手指,否则服务器将崩溃。因此,您所能做的一切都站在那儿,大喊大叫。

–汤姆·里特(Tom Ritter)
09年6月16日在17:21

大声笑..还没有想到!这本来是个更好的故事。我可以想象数据中心网络工程师拥挤不休,为问题提出不同的解决方案。也许其中一个会发布一个问题(如果SF可用的话),例如:“一旦被白痴技术人员推下路由器,我们如何禁用它的电源开关?” (+500奖励积分)

–l0c0b0x
09年6月16日在18:07

如果与我工作过的地方相似,解决方案将包括快速移开有问题的手指,并用大量胶带代替。 (然后打算安排机器停机以删除磁带,但是将其推迟18个月直到磁带最终失效为止)。

–伊恩
09年7月14日在7:40

#23 楼

我误删了某人的帐户,把名字和我想删除的名字混在一起了。 Opps

最酷的部分是他们永远不知道发生了什么。接到他们无法登录的电话,关于我删除的帐户的一分钱掉了。

和他们通电话时,我迅速重新创建了他们的帐户,并重新连接了他们的旧邮箱。 (幸好Exchange不会立即删除邮箱)并将其指向他们的旧用户文件。

然后我责怪他们忘记了刚刚为他们重置的密码:)

评论


我为需要使用该借口的球+1'和为用户撒谎-1'之间感到痛苦。

–巴布
09年7月8日在2:28

+1指责用户

– JJ01
09年8月3日,下午3:48

#24 楼

在我的Gentoo Linux机器上意外地将tar.gz文件安装在错误的位置,并且到处都有文件。一定是在1999年左右,当时是19岁(感谢下面的评论)

作为我的怪胎,我决定尝试编写自己的脚本,以免自己手动完成每个任务文件。

所以我尝试了:


tar --list evilevilpackage.tar.gz | xargs rm -rf


我花了很长时间才注意到tar也列出了程序正在使用的所有目录,其中包括''/ usr,/ var,/等等”,还有一些我真的不想消失的东西。

CTRL-C! CTRL-C! CTRL-C!太晚了!一切都消失了,重新安装时间。幸运的是,盒子里没有任何重要的东西。

评论


我不愿透露细节,但我敢肯定,Gentoo始于2002年左右

–马特·西蒙斯(Matt Simmons)
09年5月28日在18:28

是的,1.0于2002年发布。RedHat或Slackware在98年代将是一个更可能的选择。

–saschabeaumont
09年2月2日在23:59

除非他真的很顽固,否则Enoch Linux会在1999年12月发行0.75,并最终在2002年成为Gentoo的1.0版本。

– Shial
09年8月18日在13:20

当时住在我母亲的地下室,所以大约在那个时候,至少在2000年之前。不知道它是否是核心。这是继Slackware之后的下一个合乎逻辑的步骤。

– Andrioid
09年8月20日在15:00

Slackware有.tgz软件包。

– Marius Gedminas
2010-09-28 23:34

#25 楼

在我前世的一小部分时间里,我管理了公司的文件服务器,即网络软件4:11。几乎根本不需要任何输入,但是如果需要,则可以打开一个远程控制台窗口。

一直使用DOS,当我完成后,我自然会键入“ Exit” 。对于Netware,“退出”是关闭操作系统的命令。幸运的是,除非您先“关闭”服务器,否则它不会让您关闭。(使其无法用于网络/客户端)因此,当您在控制台中键入“退出”时,它会很有帮助地说:“您必须先键入”下”,然后退出”

请问我有多少次
1:在控制台会话中键入“退出”

2:顺从地键入“下” ”,然后“退出”,这样我就可以“完成我想做的事情”

然后电话开始响.....

LOL

评论


不止一次??

– BradC
2009年6月4日19:51

这就是为什么我使用^ D登出。它只是结束了一个shell会话。

–休伯特·卡里奥(Hubert Kario)
2010-10-5 20:55

#26 楼

另一个没有发生的故事(phe):

我们每天都认真地对磁带驱动器进行增量备份。

我们碰巧写了一个包含要运送数据的磁带给别人。他们说:“我们看不清您的录音带”。实际上,我们也不能。或者实际上是任何磁带。

我们购买了另一个磁带驱动器并屏住呼吸,直到安装它为止。

故事的寓意。始终确保测试备份。

#27 楼

我工作的最后一个地方,我的同事在服务器机房里带了他的孩子们(为什么?我没有想法!)。

他确保距离服务器较远,并向5岁的孩子解释说,他不应该触摸任何服务器,尤其不要触摸任何电源开关。

实际上,他把它们放在门附近...(你能看到它要去哪里吗??)

男孩没碰任何东西服务器电源按钮...不,这太容易解释了。取而代之的是,他击中了门附近的大红色按钮...关闭整个服务器房的电源的按钮!!!等不可用...想像一下要向CEO解释一下!

-JFV

评论


我们让快递员做同样的事情。尽管那之后并没有发生系统管理员事故,尽管在“红色大按钮”上突然出现了一个奇怪的金属盒。

–马蒂
09年7月14日在4:34

另请参阅“莫莉警卫队”:catb.org/~esr/jargon/html/M/molly-guard.html

– Jay_dubya
09年7月21日在7:37

我哥哥三岁时在父亲曾经工作过的一个通讯链接站点上做过同样的事情。当他拨动离地面18英寸方便的主电源开关时,一半的链接网络掉线了。幸运的是,网络已完全复制,因此没有流量丢失,但是仍然...

–staticsan
09年8月24日在23:18

@marty-正确的引语是:“为什么?我不知道。他排在第三位。我不给。 “什么?” “我不给该死。” “哦!那是我们的游击手!”

–沃伦
2010-09-29的1:30



#28 楼

我曾经与APC UPS监视软件进行过斗争。作为一家小公司,我们有几个小型UPS,并且安装了各种服务器来监视它们。大多数服务器是Linux,但是有些服务器运行Windows,因此它们被使用,因为APC软件仅是Windows。

但是,当时的APC软件被硬编码为假定它正在与之交谈的UPS也为正在运行的PC供电!该服务器不是这种情况,但是我发现为时已晚,无法停止运行。同样不幸的是,首席程序员向合作伙伴展示了该公司的产品-这是一个基于Web的应用程序,运行在我不希望APC软件关闭的同一服务器上...

评论


值得庆幸的是,我们对linux有了敬意

–休伯特·卡里奥(Hubert Kario)
2010-10-5 20:56



好吧,我们现在做。这件事是十年前的事。 :-)

–staticsan
2010-10-5 22:04

#29 楼

我正在向新的系统管理员介绍Service Manager应用程序。我说:“如果您需要停止此服务,则可以单击此按钮,但白天绝对不要这样做。”您永远不会相信她的鼠标按钮多么敏感!

两分钟后,服务又重新启动了,似乎没人注意到。

#30 楼

在跌落在机架后面的塔式服务器上绊倒时,我的头撞到了主要Cisco路由器背面。这样可以揭示出电源线实际上在Catalyst 6500正面的电源中的松动程度。

是的。现在,我们在服务器机房中挂了一个安全帽。上面写着我的名字。