背景知识:我们的部门有几台Windows服务器(2003、2008)。我们是IT部门,所以我们管理自己的服务器。在我们这四个人中,我是唯一拥有少量IT知识的人。 (请注意“少量”。)我的老板说,服务器需要至少每周重新启动一次。我不同意。我们的IT部门表示,因为她不断地重新启动它们,所以这就是我们的硬盘驱动器发生故障并且电源中断的原因。 (在过去四年中,以及最近,这两次发生在我们的一些服务器上。)

所以问题是:每个人多久重启一次Windows服务器?有行业标准或建议吗?我们的IT部门是否正确地说,因为我们重新启动,这就是我们遇到硬件问题的原因? (如果我要改变主意,我需要一个理由!)

评论

哦,大约每月的第二个星期二。 :)

ang!我们每个月的第四个星期四都在做! :)

我在对面的船上。我们不允许整个部门之间进行为期一周来回辩论的重启服务器,每个服务器大约需要12个工时。是的,这包括重新启动以进行修补,这实际上意味着永远无法完成。

每周重新启动也不应该导致硬件故障的急剧增加。

听起来您的服务器比我的笔记本电脑更频繁地重新启动。当我不使用它时,我通常将其进入睡眠模式。重新启动的通常原因是安装Windows更新或软件。

#1 楼


我的老板说服务器至少需要每周重启一次。


我非常不同意。自从[NT,有人吗?]天以来,Microsoft在稳定性和正常运行时间方面就取得了长足的进步。令人遗憾的是,IT支持人员对此的共识并未改变。


每个人多长时间重启一次Windows服务器?


仅在需要时–由于操作系统/软件更新,严重的软件故障,无法通过其他方法恢复,硬件升级/更换或其他活动,而这些故障无法通过其他方式恢复restart.1


是否有行业标准或建议?


我从来没有见过标准建议,但是我不同意任何建议(MS除外),这表明需要在特定时间间隔重新启动。 -because“。


我们的IT部门是否正确地说,因为我们重新启动,所以我们遇到了硬件问题?


重新启动[更重要的是,重启电源]是计算机硬件活动最紧张的时期。您几乎可以将所有东西旋转到100%-磁盘和风扇... ...以及组件温度的明显波动。现代硬件具有令人难以置信的弹性,但是这不应该只是每周几次反复启动服务器的原因。

1另外,我讨厌技术人员在服务失败等情况下“只是”重启Windows服务器。我了解需要重新运行该服务,但是重新启动应该是排除服务器故障的最后一步。确定并修复[!]故障的根本原因几乎永远不会导致“ Meh,只需重新启动...。”

评论


感谢您的详尽回答。我们每月进行一次更新,显然,当我们执行更新时,必须重新启动。我很感谢答案。

–埃文
2011年5月26日在15:08

我不同意你的附录。如果服务定义了服务器(例如,停止共享导出的NFS服务器),并且您知道干净的重新启动将在X分钟内恢复服务,并且在基本故障排除之后,您确定将需要x + 5来解决该问题。问题,最方便的是重新启动。之后您可以进行原因分析。现在,无论如何,这就是我的方法,您可以很容易地提出反对和反对:)我的方式。

–马修
2011年5月26日15:44

@Matthew:如果没有关于重启后丢失原因的瞬时信息,那么事后进行根本原因分析将是一件好事。当我说我宁愿有更长的停机时间来发现并解决中断的根本原因时,我想为很多人说话,而不是在我决定“重新启动”时出现许多较短的停机时间,可能会失去使用易失性信息进行根本原因分析的能力。

–埃文·安德森(Evan Anderson)
2011年5月26日15:56

@Matthew在服务失败的情况下,我希望技术人员在重新启动整个设备之前尝试重新启动服务(作为故障排除步骤)。

–jscott
2011年5月26日16:06

@Evan我同意你的看法,但是我认为必须要有一个成为问题的事件阈值。例如,如果每月发生一次,并在10分钟后通过重新启动解决,则企业可能永远不会在乎根本原因。我想您和我想知道,但是正常运行时间比根本原因更重要。但是,如果它每周发生3次,那就完全不一样了。

– Jim B
2011年5月26日16:09

#2 楼

如果您要应用补丁程序,则需要每月重新启动Windows服务器。您正在应用补丁,对吗?对吧?

评论


+1让我笑

–user82769
11年5月26日在20:03

您只每月申请补丁?

–约翰·加迪尼尔(John Gardeniers)
2011年5月27日下午2:37

严格来说,xe仅应用每月需要重新启动的补丁程序。并非所有PTF都需要重新启动,并且也不是所有的每月更新甚至都包含任何此类修复程序。

– JdeBP
2011年5月27日晚上10:52

仅在需要更新时才重新启动Windows服务器。有时,如果没有需要重启的补丁,它将花费几个月的时间。但是,我确实有几年未重启的Linux服务器,并且运行顺利。我认为我在网络中看到的最长的是一个Linux盒子,它被放入衣柜并被遗忘了(它确实获得了自动更新)。我进去了,正常运行时间是3年。一年后,由于电源故障,重新启动了它。

–詹姆斯
11年5月28日在0:04

如果是linux或BSD,则无需重新启动即可修补服务器。您只需要重启就可以进行内核更新(对于面向服务器的发行版,这种更新很少见)。

– SnakeDoc
2013年12月6日22:17



#3 楼

对于非常特殊的情况,我将给出一个替代答案。过去2-3年的发展可能已经改变了这一点,但是如果您使用的TS或Citrix服务器使用了很多交互式应用程序(如Office),则建议每周下班时间重新启动,只是从干净的表盘开始,以处理阻塞的会话,使用的桌面堆等资源。如果正确设置服务器场并错开重新启动的时间,即使您在下班时间很少使用,也不会影响用户。

当然,这是服务器的定期重新启动,但它们的使用就像台式机一样。

评论


嗯...在TS / Citrix案例上打了个好电话。

–亢奋
2011年5月26日15:41

将Citrix与CCH的审核管理软件配合使用时,具有类似的经验。

–user62491
2011年5月27日,0:56

同样适用于MetaFrame时代,当时Citrix自己建议每晚重新启动(如果可行)。

–约翰·加迪尼尔(John Gardeniers)
2011年5月27日下午2:38

是的,Metaframe ...谁。我不会错过使用打印机驱动程序映射文件的机会。从IT管理的角度来看,它肯定变得更好了。

– mfinni
2011年5月27日下午14:15

#4 楼

这是一个政治和心理问题,而不是技术性问题。

根据我的经验,某些使用某些较旧版本的Windows的人进入头脑后,他们需要每周重新启动一次,并且他们已经将这种哲学铭记在心了(尽管他们似乎从来没有注意到度假时错过了重启的机会)。除非您有一些非常不稳定的系统和应用程序,否则它们将不再现实。

另一方面,频繁的重启可能会引发硬件故障,但并非很可能是导致此故障的原因。 。

评论


我的老板是与退休的网络管理员的好朋友,后者告诉她他们至少需要每周重新启动一次……这解释了为什么她如此坚持。谢谢你的回答。

–埃文
2011年5月26日15:26

难怪他“退休了”……这是对被解雇的委婉说法吗?

– KCotreau
2011年5月26日在18:28

#5 楼

如果一切正常,则仅需要重新启动它们才能进行维护。只有在A)升级软件,B)执行硬件维护或C)处理内存泄漏而无法通过重新启动导致该问题的软件/服务解决时,才真正需要计划的重新引导。尽管众所周知Windows无法长时间运行,但确实确实发生了(上一次工作有一些Win2k盒子一次可以使用数月-他们只是工作了)。请记住,任何修补程序很可能都需要重新启动。

评论


谢谢你的回答。这应该有助于说服她。

–埃文
2011年5月26日15:27

我已经在工作网络上找到运行了多年的Windows NT,2000和2003 Boxes。直到最近,我们的数据中心都制定了年度修补政策,并拥有超过600台服务器,而且250天以上的正常运行时间并不罕见。我的服务器(大约有120个)在每个Microsoft补丁程序中得到更新并启动。有时,像上个月一样,我们没有一个周期。正常运行时间取决于服务器上正在运行的内容以及它们之间协同工作的能力。我必须运行的带有该内容的2003 R2需要每35天重新启动一次。之后发生有趣的事情。

–克里斯托弗·桑顿(Christopher Thornton)
2011年5月27日23:48



#6 楼

多年来,Microsoft在改善服务器操作系统方面做得非常出色。有些服务器在出现问题之前可以运行6到12个月,而有些服务器只能运行2到3个月。这完全取决于服务器运行的服务和应用程序。但是他们都会在某个时候出现问题。 Windows更新,内存泄漏,不完善的软件只是一些原因。

对于具有维护合同的客户,我们每月安装更新并重新启动其服务器。这些客户端对计划外服务器问题的影响要低得多,大约是不定期重新启动的问题的1/5。

对于那些说重新启动会导致硬件过早失效的人来说,有时需要重新启动硬盘驱动器和系统。但是,如今,硬盘和其他组件的构建可以承受数千个启动停止周期。如果您的服务器硬件较弱,您是希望在受控的时间内快速解决该问题,还是在工作日中途打个电话说某个部门已关闭而发生随机故障,是否希望知道它?

我认为每月定期重新启动没有不利之处,但随着时间的推移,这种好处是显而易见的。

#7 楼

我绝不是这个主题的专家,但是根据您正在运行的服务,某些服务可能会在某些计时功能(例如timeGetTime()和getTickCount())上溢出。

timeGetTime具有32位结果,该值等于自计算机启动以来的毫秒数。最多大约需要49.7天。

评论


嗯不我有一台服务器(在完全隔离,可信任的网络上,请不要向我宣扬),已经运行了14个月的大部分时间,而且没有不良影响。

– Ben Pilbrow
2011年5月26日19:34

我并不是要暗示每个服务器和实例都会有此问题,但是如果服务器使用的软件利用了这些功能并且没有考虑到这些问题,则会遇到计算问题。

–马修
2011年5月26日19:51



32位计时器问题是有效的,但这是各个软件供应商需要谨慎避免在其自己的代码中使用的问题。 Windows不再容易受到与此计时器相关的故障的影响(就像过去一样),但是如果您安装的软件无法解决计时器的回滚问题,则可能导致意外的后果。

– tylerl
2011年5月26日19:52

您是指这个Microsoft KB吗?

–jscott
2011年5月26日20:14



错了,这是赢取2k +的NT 4错误的不受此限制。我认为我们可以肯定地说NT 4在2011年就已经死了。如果有人在运行它……他们应该得到他们所得到的一切。

–Zypher
11年5月26日在20:19

#8 楼

我过去每周都会重新启动所有Windows服务器,并且肯定有一段时间需要这样做。这些天,我仅在需要更新时才重新启动它们。当然,这意味着它们仍然每隔几周就会重新启动。

#9 楼

我依靠Windows Update来配置“重新启动计划”。让Windows自己管理一次。由于内存泄漏,很少需要重新设置我们的设置...

#10 楼

我是一家在几台Windows 2003 2008服务器上运行的公司的网络管理员。我每月重新启动服务器,通常不超过3个月,因为在短时间内停机非常重要。

但是,通过补丁程序和Windows更新,我将在域控制器上安装WSUS,以根据自己的喜好按计划应用更新等。这是为了避免任何服务器更新自身并意外重新启动...

#11 楼

所有Windows讨厌的人都应按平均正常运行时间来查看运行时间最长的Netcraft.com站点(http://uptime.netcraft.com/up/today/top.avg.html)。这显示了自上次重新引导以来运行时间最长的站点,前50个站点中有95%是Windows 2003和2000计算机。和往常一样,您的里程可能会有所不同。

评论


也许您对负载平衡了解不多...

– mfinni
2012年1月11日在16:53

#12 楼

仅指定Windows可能太宽泛,无法做出合理的决定。实际上,如果考虑在Windows机器上运行的服务,角色和功能(例如:Web服务,数据库服务器等),您将做出更好的决定。

质量和行为在特定服务器上运行的第三方应用程序和Web服务数量可能表明与没有它们的其他计算机相比,需要更多/更少地频繁重启托管Windows计算机。

实际上某些第三方应用程序(不完全是设计的一个;虽然没有一个人是完美的!)可能无法以一种适时且及时的方式释放所获取的系统资源,例如内存,锁和套接字。例如,这可能会使某些崩溃的应用程序,服务或驱动程序[重新运行时]处于挂起或启动状态,这些状态如果不重新启动就很难修复。

实际上,磁盘I / O,网络和内存不足的应用程序在高负载和压力大的情况下且可用系统资源少,可能会使Windows计算机滞后,不稳定或破坏,这可能建议您尽快重新启动它们。

如果您必须运行这样的有故障的应用程序,或者必须为超过硬件/软件典型容量的用户提供服务,或者您被迫将不兼容的服务共置于一台物理计算机中,则可能会出现这种情况。您应该定期重新启动Windows。在这种情况下,您可以通过听用户对服务器速度的抱怨来调整重新启动时间!

#13 楼

除非您进行软件升级,否则永远不会有正确的答案。大约2年前,我上次重新启动服务器时,原因是电源故障。

评论


我希望您正在谈论linux服务器,或者希望您的服务器不用于专业用途...

–HTDutchy
2011年5月27日晚上10:22

需要修补的每个服务器都需要重新启动以应用其中的一些修补程序。任何暴露于公共网络的服务器都需要打补丁。

–铁路肉
2011年5月27日在12:55

我有几个NT 4域控制器,它们大约每年一次启动。没有更多的更新,也不再受到坏人的攻击……(它们没有面向互联网)

–hsmiths
11年5月28日在3:40