유럽 기반의 1인 개발자로서 올해 초부터 모든 인프라를 유럽 서비스로 전환했음 어제 Cloudflare 장애 때 Downdetector까지 같이 다운돼서 다들 웃었음. 타이밍이 절묘했음 “세 개의 Down Detector가 바에 들어왔다”는 농담이 있었음 “이건 진짜 금이야(GOLD)”라며, “그럼 다운 디텍터를 감시하는 다운 디텍터를 감시하는 다운 디텍터는 누가 감시하냐”는 메타 농담이 이어졌음 사실 Downdetector 자체가 완전히 다운된 건 아니고, Cloudflare의 인간 인증 모듈이 문제였음 “너의 다운 디텍터가 살아 있는지 감시할 또 다른 다운 디텍터가 필요함”이라는 농담이 있었음 “Sup dawg, I heard you like down detectors”라는 밈식 댓글도 있었음 Downdetector의 상태 페이지가 직접 공유되었음 “Cloudflare 장애로 Downdetector가 다운되고, 그로 인해 CloudFront까지 부하를 받은 상황”이라며 “Downdetector는 어떻게 ‘정상 상태’를 감지하나?”라는 질문이 있었음Hacker News 의견
Cloudflare 대신 Bunny.net, AWS 대신 Hetzner, 비즈니스 이메일은 Infomaniak으로 바꿨음
지금까지 단 한 번의 다운타임도 없었고, 미국 서비스에서 완전히 분리된 느낌이 정말 좋음
대기업 환경에서는 “AWS 썼으면 이런 일 없었을 텐데”라는 말이 흔함. 예전 IBM처럼 말임
Hetzner는 AWS보다 훨씬 단순한 서비스 세트를 제공해서 복잡성이 적음
다만 브랜드 인지도나 ‘프로페셔널해 보이는가’라는 문화적 요인도 여전히 큼
인프라 선택은 자유지만, 가용성에 대한 인식이 실제와 다를 수 있음
유지보수 공지가 있었지만 해당 서버는 영향 목록에 없었음
Hetzner가 나쁘다는 건 아니고, 유럽에서도 이런 사소한 사고는 일어남
Bunny.net이 그 역할까지 대체할 수 있는지는 의문임
첫 번째가 “모르겠음”, 두 번째도 “모르겠음”, 세 번째가 “예”라고 답함
그래서 기술적으로는 “정상”이었지만 실제로는 사용할 수 없었음
“Downdetectorsdown이 끝없이 이어지는 구조”라는 말도 나왔음
다운 디텍터들이 서로 하트비트를 주고받으며 감시하면, 일부가 죽어도 전체는 살아남는 구조가 가능함
자가 치유 구조를 갖추면 훨씬 탄력적인 네트워크가 됨
그 부하까지 견딜 수 있는 새로운 CDN을 만들어보라는 도전이 제시됨
Cloudflare 장애 당시 인덱스 페이지는 200을 반환했을 수도 있음
헤드리스 브라우저로 스크린샷을 찍어 확인하려 하면 Cloudflare에 의해 차단될 듯함
script.js의 fetchStatus()가 generateMockStatus()를 호출해 무작위 응답 시간을 만들어내는 구조임
즉, 진짜 상태를 체크하는 게 아니라 모의 상태 데이터를 보여주는 방식임

3 weeks ago
7










English (US) ·