更新2019-04-23:维护按计划进行。




当前状态我们遇到了一些意外问题并已重新安排-以下标题和日期已更新。下面列出的星期一/星期二的工作已经完成,其余工作将在我们执行故障转移的当天完成。

dr:dr:计划的服务中断将影响所有Stack Overflow / Stack Exchange站点,作业,聊天和团队。在维护过程中,所有站点都将保持只读状态,最长不超过一个小时。企业云托管实例不会受到影响。

简短版本:

下一周将有一个小时的服务降级-可能是2019年4月23日,23 :30 UTC(美国东部标准时间晚上7:30)。在此期间,问题和答案仍将显示,职位列表仍将起作用,职位广告仍将显示。但是,该网站将是“只读的”,即人们将不会登录,不会添加/编辑新的工作清单,申请工作,创建,编辑或对问题/评论/答案进行投票,名声不会改变,等等。这应该最大程度地减少对大多数休闲读者的干扰。我们将在网站上显示横幅,表明我们“只读”进行维护。我们希望该网站处于只读状态的时间少于一个小时。

有关发生了什么的更多技术版本?

背景

我们的主要数据库服务器当前正在Windows Server 2012上运行。我们有两个Windows故障转移群集,一个用于堆栈溢出,一个用于堆栈Exchange(职业),每个群集包含三个数据库服务器。我们将服务器升级到Windows Server2016。在服务中断期间,我们将对Windows Server 2012上仍然存在的服务器执行故障转移,将其故障转移到Windows Server 2016上已经存在的服务器。

我们做什么?会在做

如前所述,我们使用Windows故障转移群集,SQL Server永远在线可用性组和分布式可用性组来使我们的数据在各个服务器之间保持同步,同时为我们在多个位置(NY和CO)提供冗余。从下周开始,我们将把这些服务器上的操作系统升级到Windows Server2016。

此次升级涉及许多动静的部分,但高级别我们将在下周进行以下操作:


星期一:我们将从现有的Windows故障转移群集中删除NY服务器(当前为辅助服务器)。该服务器将全新安装Windows Server 2016,将创建新的故障转移群集,将重新安装SQL Server 2017,并且我们将创建新的可用性组和新的分布式可用性组。这样,该服务器应开始从当前的主SQL Server(即仍在旧的2012群集中的一个)接收数据。
星期二:另一个NY Secondary将遵循与星期一相同的路径。
星期三:CO中的远程辅助服务器将从旧的2012年群集中删除,进行重建,并放入新的2016年故障转移群集中。

至此,我们将获得批准/否-在故障转移上。如果一切都按计划进行,并且我们感到满意,那么我们将执行故障转移(定期维护)。如果发生任何延迟或出现意外问题,我们将把维护推迟到以后。

除非感到满意,否则我们将不会继续进行故障转移。

执行维护时,我们会将应用程序指向新的2016服务器并执行分布式可用性组的SQL故障转移。我们预计该网站将处于只读状态约一个小时。在这段时间里,我们将在@StackStatus上发布进度公告和更新,因此如果您有兴趣的话,请继续关注。

这是我们正在做的非常复杂的举动,已经在实验室环境中进行了全面测试,但是在这些类型的操作中您将一无所获。正如尼克·克雷弗(Nick Craver)所说:


每个人都有一个计划,直到他们被人咬住为止-Mike Tyson


问题还是疑虑? >
请在下面发表评论或回答;我将尽力解决从现在到维护时段之间的所有问题。

评论

我帮你指点:P

@TimStone我们还需要更多。 :)

好吧,我也去买一些朗姆酒或其他东西

当您同时进行聊天时,我们是否有可能在直播中观看所有这些内容?还是您希望我们在外面走走,呼吸新鲜空气,然后在那个小时内与真实的人耸耸肩交谈?

@rene我认为这次不会有直播,除非在现在和维护日之间有所变化。有大量的活动部件,这又增加了一层内容。

等一下...我要...去睡觉!?

期待在六到八周内升级到Server 2019.

@MichaelHampton是最初的计划,但是我们遇到了很多问题,因此决定在2016年为我们提供了我们希望在SQL方面进行的改进。同样,最大的痛苦就是离开2012年,如果我们使用2012 R2,这不会那么复杂。

🔺感谢您的通知。

标语文字:我们仅保留60到80分钟以进行维护。

为什么不走AWS路线,迁移到云?

哈! AskDifferent,AskUbuntu和Unix StackExchange网站正在Windows Server上运行:)

为什么要使用Windows Server?

@AndrewMorton当然,我们会分享。我们在SQL Server和分布式AG中发现了一个重大错误。 Microsoft与我们合作解决了这个问题,但是将在下一个CU中发布修复程序。

我希望这很快结束。在这些时间里我会变成什么样?我要去哪里我会是什么?

#1 楼

只是不要花太长时间。我不知道我能等多久不评论,回答或编辑帖子。

这是我的生活。

#2 楼

我们如何知道维护是否已经完成?

评论


完成后或如果延迟到4月18日之后,我们将更新此信息。

– Taryn♦
19年4月18日在12:34

它将发布推文!

–Chirag Jain
19年4月21日在5:06

#3 楼

维护完成后,我们会被故事,个人戏剧,克服的困难甚至是悲剧和浪漫所震撼吗?

评论


是的,我会写博客。如果您一直在Twitter上关注我或Nick,您会发现事情进展不顺利。

– Taryn♦
19年4月19日在21:52