请记住,“大型服务器农场”被设计为除非必须这样做,否则永远不会关闭。这意味着这是一个可能性,但非常遥远的事件,当它发生时,你会非常匆忙。每一个其他用例,例如关闭机架或在电源线上进行工作,都将尽可能提前计划好。
当事情变得非常糟糕时,你会真的匆忙起来。
例如,发电机耗尽燃料(通常会保留至少一天的储备量并签有合同及时补给,所以我们在谈论重大灾难),或类似的事件,你会知道在关闭之前还有几个小时的时间来关闭东西。或 HVAC 系统完全失效,然后你只有极短的时间来关闭所有东西,以免温度上升过高。
我不是这方面的专家,我是护城河的另一边(数据中心的客户),但我认为他们会有相应的系统来指挥关闭他们所控制的所有系统,而对于他们无法控制并能够正确关闭的客户系统,他们只需切断电源即可。
The farm will be eventually powered up again one zone at a time, one rack at a time, when all systems are back online and ready to go full capacity (UPSes, generators, HVAC, etc).
When they have full control of the systems (i.e., not customer ones but private farms) they will usually bring AC gradually to all circuits, and servers will either power up automatically (if configured to do so, and many servers can even have a setting like "power up after a random time of max X minutes") or they will be commanded to power up via lights-out management like IPMI or similar systems.