Cloudflare CDN报错522代码

4
(1)

6月末的时候,cloudflare曾经报错522代码,即源站无法连接的错误。那也是我之前写的一篇文章,今天把它恢复以下。

昨天下午,网站一直报错522代码,即浏览器网络正常,浏览器与Cloudflare之间的连接正常,而Cloudflare无法与源站通讯。本站服务器用的是Godaddy,因此多半是Godaddy那里出现了问题。然后,我登录了下Godaddy后台,发现速度很慢,挂代理勉强可以连接。

Cloudflare CDN报错522代码

不断的尝试,我发现访问网站首页正常,只要一刷新或者访问其他页面就报错522。不然就是其他页面可以访问,然后刷新就报错。这一点可以判断,流量完全走了Cloudflare,即我访问到的是缓冲页面。直到晚上,这一故障才解除。

事件描述

今天下班回家,我就看到了Cloudflare发送的邮件,大体上就是说了这次重大522报错事故,而且不止Godaddy一家服务器,其他服务商也有很多出现Cloudflare无法通讯的情况,即522报错。

Cloudflare CDN报错522代码

以下,是对邮件的翻译结果:

Cloudflare
今天,从UTC大约10:03开始,主要外部网络提供商的配置错误导致了Internet的连接中断。这些中断影响了包括Cloudflare在内的许多服务提供商的运营。 Cloudflare的系统解决了该问题,但是,尽管我们采取了一些缓解措施,但在使用期内,一些使用Cloudflare的Internet属性在出错期间的错误率有所增加。

在此期间,我们看到整个网络的流量下降了约3.5%,并且HTTP错误增加了,该错误可能表示为522(连接超时)状态代码。

我们已经在Cloudflare博客上发布了由首席执行官撰写的有关此事件的初步详细分析。目前,我们不再看到这些运输提供商问题对Cloudflare的其他影响。

我们了解这些事件可能造成的破坏性,我们将继续在cloudflarestatus.com上提供影响Cloudflare网络的问题的最新更新。

Cloudflare团队

以下为Cloudflare博客Matthew Prince作者发布的此次事件的描述

Today CenturyLink/Level(3), a major ISP and Internet bandwidth provider, experienced a significant outage that impacted some of Cloudflare’s customers as well as a significant number of other services and providers across the Internet. While we’re waiting for a post mortem from CenturyLink/Level(3), I wanted to write up the timeline of what we saw, how Cloudflare’s systems routed around the problem, why some of our customers were still impacted in spite of our mitigations, and what appears to be the likely root cause of the issue.

原文意思大概是:今天,CenturyLink/Level(3),主流的ISP及国际带宽提供商,遭受了严重的中断。不仅影响了Cloudflare的一些客户,还影响了网络上的其他服务商及带宽提供商。此外,作者提供了整个事件发生的时间线。

在世界标准时间10:03,我们的监视系统开始观察到到达客户的原始服务器的错误数量有所增加。这些显示为“ 522错误”,表明从Cloudflare的网络连接到托管我们客户的应用程序的任何地方都存在问题。

错误显著增加

下图,Cloudflare向我们展示了在遇到错误的时候,它会尝试连接其他服务提供商以连接源服务器(即客户的源站)。

Cloudflare CDN报错522代码

自动缓解错误

下图,向我们展示了Cloudflare的网络运营中心也收到了警报,在世界标准时间10:09开始无法自动解决本次大面积522报错情况,团队开始采取其他措施来缓解自动化系统。即使在失去作为我们的网络提供商之一的CenturyLink/Level(3)的情况下,我们仍然成功地为大多数客户和最终用户确保了网络中的流量通过。

Cloudflare CDN报错522代码

下图显示了Cloudflare的网络与网络提供商之间的六个主要的1级主要网络之间的流量。红色部分显示CenturyLink/Level(3)流量,该流量在事件期间降至接近零。您还可以查看在事件发生期间我们如何自动将流量转移到其他网络提供商,以减轻影响并确保流量继续流动。

Cloudflare CDN报错522代码

下图显示了事件发生期间整个网络上的522个错误(表明Cloudflare无法到达客户的应用程序)。

Cloudflare CDN报错522代码

CenturyLink/Level(3)网络失败在UTC在10:03时急剧增加。自动化系统立即开始尝试重新路由和重新平衡其他网络提供商之间的流量,导致错误立即减少一半,然后由于自动优化这些路径而降低到峰值的25%。

在10:03 UTC和10:11 UTC之间,系统在48个城市中自动禁用CenturyLink/Level(3),并在备用网络提供商之间重新路由了流量。为了防止级联故障,系统在转移流量之前会考虑其他提供商的容量。这就是为什么故障转移(虽然是自动的)并非在所有位置都即时发生的原因。团队能够应用其他手动缓解措施,以将错误数量再减少5%。

错误无法降低为0

不幸的是,仍然存在大量错误,表明我们仍然无法吸引某些客户。CenturyLink/Level(3)是世界上最大的网络提供商之一。结果,许多托管服务提供商只能通过其网络与Internet进行单宿主连接。

网络的另一侧(用户)也存在同样的问题。个人需要进入互联网的高速公路。ISP实质上就是向Internet的匝道。CenturyLink是美国最大的ISP之一。

Cloudflare CDN报错522代码

事件回顾

  • 本次事件,由世界上最大的CenturyLink/Level(3),ISP及宽带提供商错误导致;
  • 本次事件,Cloudflare将报错率降低至5%;
  • 由于用户连入网络也可能经过CenturyLink/Level(3),错误无法完全避免。
  • UTC10:03,大约相当于北京时间18:03
  • 虽然我昨天的情况,可能真的是Godaddy自己的问题。但,这篇文章还是可以发的

Cloudflare官方博客关于本次事件的描述,大致为以上内容。

共计1人评分,平均4

到目前为止还没有投票~

很抱歉,这篇文章对您没有用!

让我们改善这篇文章!

告诉我们我们如何改善这篇文章?

文章目录

原创文章,作者:古哥,转载需经过作者授权同意,并附上原文链接:https://iymark.com/articles/301.html

(1)
微信公众号
古哥的头像古哥管理团队
上一篇 2020年10月08日 13:50
下一篇 2020年10月08日 14:16

你可能感兴趣的文章

发表回复

登录后才能评论
微信小程序
微信公众号