阿里云服务器ECS    
弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新 [咨询更多]
阿里云存储OSS
简单易用、多重冗余、数据备份高可靠、多层次安全防护安全性更强、低成本 [咨询更多]
阿里云数据库RDS
稳定可靠、可弹性伸缩、更拥有容灾、备份、恢复、监控、迁移等方面的全套解决方案 [咨询更多]
阿里云安全产品
DDoS高防IP、web应用防火墙、安骑士、sll证书、态势感知众多阿里云安全产品热销中 [咨询更多]
阿里云折扣优惠    
云服务器ECS、数据库、负载均衡等产品新购、续费、升级联系客服获取更多专属折扣 [咨询更多]
雪花服务器是什么
2020-8-17    点击量:
  雪花服务器和网络中的其他所有服务器都不同。它非常特殊,无法复制。
  
  几年前,我在一家为客户构建Web应用的公司里管理服务器,其中大部分Web应用都是庞大、复杂的Perl CGI脚本。(不要批评我们,那是.COM年代,大家都这么做。)我们一开始使用的是Perl 5.6,但是后来最好的类库都升级到了Perl 5.8,而且不兼容5.6。最后,几乎所有的新应用都是基于Perl 5.8实现的,但是有一个特别重要的客户应用程序就是无法运行在5.8上面。
  
  实际的情况比这更糟糕。这个应用程序在升级共享的预发布服务器到5.8时运行正常,但是在升级预发布环境时却崩溃了。不要问我们为什么没有解决预发布环境的问题就把产品环境升级到了5.8,最后的结果就是这样的。我们有一台特殊的服务器可以运行Perl 5.8的应用程序,但其他服务器都不行。
  
  我们就这样可耻地持续了很长时间——在预发布服务器上保留Perl 5.6,每次部署到产品环境时都祈祷不要出问题。我们不敢触碰产品服务器上的任何东西,害怕解除能使唯一服务器运行客户应用的魔法。
  
  这样的情况促使我们发现了Infrastructures.org,这个网站为我打开了基础设施即代码的大门。我们确保以可重复的方式构建所有的服务器,用全自动安装(fully automatic installation,FAI)工具安装操作系统,用CFEngine配置服务器,并将所有的东西都用版本控制系统管理起来。
  
  大多数IT运维团队都有过这样的尴尬:不能触碰或者难以复制服务器。如此脆弱的原因并非总是神秘莫测,有时是因为某个重要的软件运行在与其他服务器完全不同的操作系统上。我记得有个会计软件需要运行在AIX上,而另一个运行在Windows NT3.51服务器上的PBX系统则是由一个已被遗忘的承包商特别安装的。
  
  再次强调,不一致并非坏事。问题在于拥有服务器的团队对于服务器如何以及为何不一致一无所知,并且无法重建服务器。运维团队应当能够自信、快速地重建基础设施中的任意服务器。如果有任何服务器不能满足这个需求,团队的最高优先级应该是设立一个可复制的全新流程,来构建一台新的服务器并替换掉老的服务器。
  
  脆弱的基础设施
  
  脆弱的基础设施很容易中断,而且不容易修复。这是由于雪花服务器问题扩展到了整个系统组合。
  
  解决方案是逐步将基础设施中的一切迁移到可靠、可复制的基础设施里。Visible Ops Handbook一书论述了如何在困难的基础设施上实现稳定性和可预测性。
  
  不要碰那台服务器,别指它,甚至不要看它
  
  这也许是一个虚构的故事:数据中心里有一台服务器,没有人知道登录的信息,也没有人知道那台服务器的作用。有人以身犯险,将那台服务器的电缆从网络中拔掉。整个网络彻底断了。于是,电缆被重新插回,没有人敢再动那台服务器了。
联系客服免费领取更多阿里云产品新购、续费升级折扣,叠加官网活动折上折更优惠