您的位置:首页 人工智能

“Fastly”or“Faulty”?美国云计算服务提供商宕机引发全球网站大瘫痪

来源:中国电子报    2021-06-11
北京时间6月8日下午至晚间,一场突发的大规模宕机事件席卷了英、美、澳、日、法等全球多地。CNN、BBC、彭博社、《金融时报》、《纽约时报》、《卫报》、《世界报》、推特、亚马逊、eBay、半岛电视台、日本读卖新闻等各大媒体网站,甚至英国政府网站、日本金融厅网站等纷纷沦陷,给用户造成大范围影响。

北京时间6月8日下午至晚间,一场突发的大规模宕机事件席卷了英、美、澳、日、法等全球多地。CNN、BBC、彭博社、《金融时报》、《纽约时报》、《卫报》、《世界报》、推特、亚马逊、eBay、半岛电视台、日本读卖新闻等各大媒体网站,甚至英国政府网站、日本金融厅网站等纷纷沦陷,给用户造成大范围影响。

据悉,这次事件是由美国云计算服务提供商Fastly的内容交付网络(CDN)服务故障引起的,宕机网站皆使用了Fastly的CDN服务以加快访问速度。Fastly在第一批宕机报告出现一小时内执行了修复程序,大部分网站已快速恢复服务。

CDN 出现中断,导致 Fastly 的客户端站点瘫痪

Fastly也因此一战成名,火速登上了推特热搜榜的第1名。这家创立于2011年3月的CDN服务独角兽企业通过构建以云端为基础的边缘平台,将客户内容存放在世界各地的边缘服务器上,再由各个边缘平台向周边的终端使用者提供服务,所有需要用到的存取运算、负载平衡等功能均在边缘节点完成,让终端使用者可以感受到更迅速的网络加载速度。边缘计算与CDN技术的深度融合是Fastly从众多CDN服务公司中脱颖而出的制胜法宝。

据介绍,Fastly能够通过边缘服务器网络使网页加载速度最快达到20~30毫秒,其边缘云平台的连接边缘容量已达到每秒100 TB,每天能够处理超过8000亿个请求。目前,这家公司服务的行业已拓展至金融、电商、旅游、科技、网络传媒、流媒体等诸多领域,明星客户更是遍布全球。它在2015年首次进入中国市场,字节跳动也曾是它的核心客户之一。

这样来看,CDN服务按道理来讲应该是Fastly的“老本行”,那为什么还会出现这样的问题呢?Fastly 在声明中表示:“一种服务配置影响了全球服务器的正常工作。”该公司已禁用该配置。分析人士指出,CDN 的某些部分出现了中断,导致 Fastly 的客户端站点瘫痪。

神州数码集团云业务集团总裁、云角创始人及CTO郝峻晟对《中国电子报》记者解释说:“引发CDN故障的原因有很多,可能是服务器网络中断导致的,也可能是更新升级中的误操作,亦或是管理失策导致的。宕机其实很常见,完全避免是不可能的,主要是看恢复时长和数据恢复情况。一般采取的措施是第一时间开启备份机房恢复服务,然后再去查找故障原因、修复数据,但在此过程中,商业利润的损失无法避免。”

关于应急预案,郝峻晟建议:“首先要做好多云备份,其次是数据同步,另外还有一点很重要,选择专业的云托管服务商,可以有效降低因为人为错误导致的宕机事件发生概率。”

帮助用户用好云、管好云才是关键

此前,《中国电子报》曾针对2020中国云计算企业用户满意度进行了调研。调研结果显示:尽管上云已是大势所趋,但许多用户在上云与用云、管云过程中依然面临着大量的难题、困惑和迷茫。比如,看不懂账单与参数指标,不知道该怎么买云、怎么用云。再比如不清楚云计算厂商不同级别的服务内容与范围,难以获得及时有效的售后服务支持。还有混合多云架构带来的管理难题等。

像此次遭遇宕机事件的用户,其实也同样面临这些问题。网站异常导致生产环境不能正常工作是经常出现的难点之一。对于有经验的云服务提供商来说,工程师可以凭借自己丰富的经验,以最快的速度确定恢复客户环境的最优方案,并通过远程的方式,帮助客户恢复服务器、网站以及数据。Fastly作为他们的云计算服务提供商,在故障发生后,要做的不仅仅是尽快解决自身技术问题,还需要及时为用户提供配套服务与支撑,与用户一起建立、完善相关的灾备应急预案。

《中国电子报》调研报告建议,对于云计算用户而言,应多方位考虑厂商优势与自身需求匹配度,选择更贴合自身业务需求的的云服务商;对于云服务提供商而言,应从业务助力指标、服务团队素质指标、服务成熟度指标、硬件管理成熟度指标、行业经验指标、云服务经验值指标等多个维度来全面优化云上服务能力,提升客户满意度。

事实上,上云只是第一步,如何真正地帮助用户用好云、管好云才是评估一家云服务商是否足够优秀的关键。这次波及全球的宕机事件无疑给云服务商们提了一个醒,千里之堤,溃于蚁穴,在云计算的世界里没有小事。(作者:宋婧)

声明:本文版权归原作者所有,转发仅为更大范围传播,若有异议请联系我们修改或删除:[email protected]
0