챗GPT·퍼플렉시티 동시 서비스 중단 발생
18일 오후 10시 20분경부터 오픈AI의 챗GPT와 RAG 스타트업 퍼플렉시티의 서비스가 거의 동시에 중단되었다. 사용자들이 해당 사이트에 접속을 시도하면 'challenges.cloudflare.com 차단을 해제하십시오'라는 메시지가 표시되고 있다. 오픈AI는 공식 상태 페이지를 통해 '일부 사용자는 챗GPT와 플랫폼 웹사이트가 다운되고 있다'며 'API, 챗GPT, 소라(Sora) 서비스의 문제를 조사 중'이라고 공식 발표했다. 이번 장애는 단순한 개별 서비스 문제가 아닌 대규모 인프라 장애로 확인되고 있다.
클라우드플레어 글로벌 인프라 장애가 근본 원인
이번 서비스 중단의 근본 원인은 글로벌 인터넷 인프라를 담당하는 클라우드플레어(Cloudflare) 서버의 장애로 확인되었다. 클라우드플레어는 전 세계 웹사이트의 약 20%에 CDN(콘텐츠 전송 네트워크) 서비스를 제공하는 핵심 인프라 업체다. 챗GPT와 퍼플렉시티 모두 클라우드플레어의 서비스를 이용하고 있어 동시에 영향을 받게 된 것이다. 클라우드플레어의 장애는 단순한 서버 다운을 넘어 보안 검증 시스템까지 마비시켜 사용자들이 'challenges.cloudflare.com' 관련 오류 메시지를 보게 된 것으로 분석된다. 이는 클라우드플레어가 제공하는 DDoS 보호 및 보안 서비스의 일환이다.
AI 서비스 생태계 전반에 미치는 파급효과
이번 장애는 AI 서비스 생태계 전반에 상당한 파급효과를 미치고 있다. 특히 챗GPT의 경우 전 세계 수억 명의 사용자가 일상적으로 이용하는 서비스로, 업무와 학습에 직접적인 지장을 초래하고 있다. 퍼플렉시티 역시 검색 기반 AI 서비스로 급성장하고 있는 플랫폼이어서 사용자들의 불편이 가중되고 있다. 기업 고객들의 경우 API 서비스 중단으로 인해 자체 서비스 운영에도 차질이 빚어지고 있다. 이는 클라우드 의존도가 높은 현대 디지털 서비스의 취약성을 다시 한번 드러내는 사례로 평가된다. 단일 인프라 업체에 대한 과도한 의존이 시스템 전체의 리스크로 작용할 수 있음을 보여주고 있다.
재발 방지와 인프라 다변화 필요성 대두
올해 9월에도 클라우드플레어 서버 장애로 제미나이, 챗GPT 등 주요 AI 서비스가 일시 중단된 바 있어, 이번이 두 번째 대규모 장애다. 이는 글로벌 디지털 인프라의 집중화 위험성을 명확히 보여주는 사례로, 업계에서는 인프라 다변화의 필요성이 제기되고 있다. AI 서비스 제공업체들은 단일 CDN 업체에 대한 의존도를 줄이고 다중 인프라 구조를 구축해야 한다는 목소리가 높아지고 있다. 또한 장애 발생 시 신속한 복구와 사용자 커뮤니케이션 체계 개선도 시급한 과제로 지적되고 있다. 클라우드플레어 측에서는 장애 원인 분석과 재발 방지 대책 마련이 필요한 상황이다. 향후 AI 서비스의 안정성 확보를 위한 업계 차원의 대응 방안 논의가 활발해질 전망이다.