전 세계 윈도우 블루스크린 사태: 왜 한국은 피해가 적었을까?

세계 컴퓨터 블루스크린 발생해서 비행기도 못 떴답니다. 왜 그런지 제가 좀 알아봤습니다.

안녕하세요, 형님, 아우님. 어제 큰일이 있었죠? 전 세계적으로 컴퓨터가 블루스크린이 떠서 비행기도 못 뜨고 여러 곳에서 큰 혼란이 있었답니다. 어제뿐만 아니라 과거에도 주기적으로 일어났고 앞으로도 일어날 겁니다. 왜 그런 일이 일어났는지 쉽게 설명해드릴게요.

맥도날드 키오스크 블루스크린

맥도날드 키오스크 블루스크린

 

블루스크린 사태 발생 이유가 뭐예요?

이번 사태는 윈도우의 협력업체인 크라우드스트라이크(CrowdStrike)라는 보안 회사가 윈도우 보안 업데이트를 하다가 오류가 생겨서 발생한 겁니다. 이 때문에 윈도우가 부팅이 안 되는 문제가 생겼어요. 컴퓨터 고치다 보면 업데이트하다가 뻑나서 수리 맡기는 경우가 생각보다 꽤 많아요. 이번에는 마이크로소프트 회사 자체의 실수가 아니라, 협력업체에서 사고를 친 거죠. 결과적으로 크라우드스트라이크는 주가가 하루 만에 11%나 빠졌어요. 책임을 져야지요.

크라우드스트라이크 주가 11% 하락

크라우드스트라이크 주가 11% 하락

 

전 세계 윈도우 동시다발 블루스크린 발생 이유가 뭔가요?

회사업무 마비= 퇴근

회사업무 마비= 퇴근

많은 분들이 궁금해하시겠죠. 나도 윈도우를 쓰는데 우리 집에는 괜찮은데 왜 그런가요? 이번 사태는 주로 기업과 기관에서 사용되는 시스템에 영향을 미친 것입니다. 개인 사용자 중 일부도 영향을 받았을 수 있지만, 대부분은 큰 문제가 없었을 거예요.

클라우드 서비스가 중요한 이유

클라우드 서비스는 데이터를 중앙 서버에 저장해 놓고 필요할 때마다 인터넷을 통해 사용하는 것입니다. 기업들은 서버 관리를 전문적으로 하는 회사에 돈을 주고 서버를 임대합니다. 이렇게 하면 기업은 본업에 집중할 수 있고, 서버 관리는 전문 업체가 책임지게 됩니다. 이것이 바로 클라우드 서비스의 장점입니다.

여기서 클라우드 서비스가 왜 중요한지 설명드릴게요. 대형 기업이나 기관에서는 각개별로 서버를 두고 일하지 않습니다.
그 이유는 비용 때문인데요. 예를 들어, 아재가 리니지라는 게임을 한다고 가정해봅시다. 리니지가 오픈 초기에 동시접속자가 10만 명일 것이라 예상해서 10만명 수용 규모의 서버를 구축했습니다. 그런데 몇 달 뒤에 1만 명으로 줄어들거나, 반대로 100만 명이 동시 접속한다고 해봅시다.

사람들이 얼마나 들어올지 모르니 동시 감당 인원을 정확하게 예측하기 어렵습니다. 만약 예측이 틀려서 예상보다 적게 1만명만 접속하면 서버 유지 비용이 쓸데없이 많이 들게 되고, 예상보다 많이 대박이 터져 100만명이 접속하면 신규 인원을 수용할 수 없게 되어 신규 유저가 접속을 못하니 기업은 돈을 못 법니다.

그래서 기업들은 서버를 직접 운영하는 대신, 서버를 임대합니다. 이것이 클라우드 서비스를 이용하는 이유입니다.

전 세계 클라우드 서비스 점유율

전 세계 클라우드 서비스 점유율을 보면, AWS가 33%, MS Azure가 21%, 구글 클라우드가 8%, 알리바바 클라우드가 6%를 차지하고 있습니다. 이번 사태는 MS Azure에서 발생했기 때문에 전 세계적으로 큰 문제가 되었습니다. MS Azure는 마이크로소프가 운영하는 클라우드 서비스 이름입니다.

전세계 기업별 클라우드 시장 점유율

전세계 기업별 클라우드 시장 점유율

 

국내 장애의 영향

제주항공, 이스타항공 등 국내 항공사 발권 시스템 마비

이번 사태로 여러 항공사의 발권 시스템이 마비되었습니다. 제주항공, 이스타항공, 에어프레미아, 제스타, 홍콩 익스프레스 등이 영향을 받았어요. 이들 항공사가 사용하는 예약 발권 시스템인 나비테어(Navitaire)는 마이크로소프트의 클라우드 서비스를 기반으로 운영되는데, 이게 문제가 되어서 모든 승객들이 홈페이지나 앱에서 예약과 발권을 할 수 없게 됐습니다. 그래서 공항 발권 창구에서 일일이 종이 탑승권을 발권받아야 했습니다.

인천 국제공항에서는 발권 지연으로 인해 20여 편의 항공기가 지연 출발했습니다. 승객들은 모바일로 예약한 뒤 공항에 와서야 문제가 발생한 것을 알게 되어 큰 불편을 겪었습니다. 해외 놀러 갈라던 사람들 일정 꼬여버렸습니다.

펄어비스와 그라비티의 긴급 점검

펄어비스는 외부 소프트웨어의 전 세계 동시 장애로 인해 인기 게임 ‘검은 사막’의 운영이 중단되었어요. 이로 인해 펄어비스는 몇 시간 동안 서버 점검을 진행해야 했습니다. 게임 서버가 중단되면서 몇 시간 사냥못했습니다. 몇 시간뒤 정상화되었다고 합니다.

그라비티도 비슷한 문제를 겪었어요. 그라비티는 오후부터 홈페이지와 게임 접속에 장애가 발생하여 긴급 점검을 진행했습니다. 이는 게임 서버가 클라우드 서비스를 이용하고 있었기 때문에 발생한 문제였습니다. 그라비티도 겜 접속 안되었습니다.

과거 유사 사례

2021년 아마존 클라우드 서비스 중단

2021년, 아마존 웹 서비스(AWS)가 중단되면서 넷플릭스, 아마존닷컴, 디즈니플러스 등 주요 서비스가 마비되었습니다. 당시 AWS의 중단은 데이터 센터의 네트워크 연결 문제로 인해 발생했으며, 이로 인해 수많은 웹사이트와 온라인 서비스가 큰 타격을 입었습니다. 이 사건은 클라우드 서비스의 의존도가 높아지면서 발생할 수 있는 대규모 장애의 위험성을 잘 보여줍니다.

2022년 1월 마이크로소프트 클라우드 서비스 중단

2022년 1월, 마이크로소프트의 클라우드 서비스인 Azure가 중단되면서 이메일, 은행 통신, 병원 등 전 세계적으로 문제가 발생했습니다. 이번 중단은
Azure Active Directory(AAD)에서 발생한 문제로 인해 사용자가 인증되지 않아 다양한 서비스에 접속할 수 없게 되었습니다. AAD는 마이크로소프트의 클라우드 기반 ID 및 액세스 관리 서비스로, 많은 기업과 기관에서 사용하고 있습니다. 이로 인해 수많은 이메일 서비스, 금융 거래, 병원 시스템 등이 중단되었고, 전 세계적으로 큰 혼란이 발생했습니다.

국내에서 이런 문제가 덜 발생한 이유

국내 클라우드 시장 점유율

국내 클라우드 시장 점유율

이번 전 세계적인 윈도우 블루스크린 사태에서 국내는 상대적으로 피해가 적었습니다. 아이러니하게도, 이는 국내 공공기관과 민간 기업들이 주로 국내 인증된 클라우드 서비스를 사용하기 때문입니다. 국내 기업들이 외부 클라우드에 대한 의존도가 낮기 때문에, 글로벌 클라우드 서비스 장애의 영향을 덜 받았습니다.

공공기관의 경우

국내 공공기관은 해외 클라우드 서비스를 이용할 수 없습니다. 정부의 인증을 받은 클라우드 서비스만 사용할 수 있기 때문입니다. 이러한 규제는 데이터 보안과 보호를 강화하기 위한 조치로, 국내 업체만이 이 인증을 통과할 수 있습니다. 따라서 공공기관은 네이버 클라우드, KT 클라우드, 삼성SDS 클라우드 등 국내 클라우드 서비스를 사용하게 됩니다.

민간 기업의 경우

국내 민간 기업들도 핵심 서비스를 주로 자체 인터넷망이나 국내 클라우드 서비스를 통해 운영합니다. 예를 들어, 금융 회사들은 핵심 데이터를 외부 클라우드에 의존하지 않고 자체 망을 통해 관리하는 규제가 있습니다. 이는 보안과 안정성을 강화하기 위한 조치입니다.

결론적으로

우리나라에서는 클라우드 시장에서 자유 경쟁을 하지 않고 폐쇄정책을 취하기 때문에 어제와 같은 일이 발생하지 않았다고 볼 수 있습니다. 이와 유사하게 휴대폰 시장도 국내 통신 3사가 독점하고, 은행도 시중 4대 은행이 독점하고 있죠. 사업이 철밥통입니다. 이러한 독점 구조 때문에 새로운 금융환경이 잘 조성되지 않고, 전 세계에서 투자 상품이 가장 적은 나라 중 하나입니다. 휴대폰도 전 세계에서 가장 비싸게 구매해야 하죠. 소비자는 선택의 폭이 좁습니다. 그런데 아이러니하게도, 이런 폐쇄적인 시장 구조가 어제와 같은 클라우드 분야의 문제에서는 도움이 되었습니다.

앞으로 이러한 사안을 생각해보면, 관련 업계에 있으면서 이런 문제를 100% 원천적으로 막을 수는 없다고 봅니다. 인간이 하는 작업이기에 오류는 발생할 수밖에 없죠. 중요한 것은 얼마나 빨리 오류를 수정하고 피해를 최소화하느냐입니다. 운영체제에 파일만 수만 개인데, 어떻게 모든 오류를 100% 막을 수 있겠습니까? 해커들도 해킹해서 돈을 뜯어가려고 혈안이 되어 있는데, 모든 것을 원천적으로 막는 것은 불가능합니다. 그러니 중요한 것은 빨리 피해를 인지하고 최소화하는 것이 최선이라고 봅니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다