클라우드 전문정보

제목 [2부] 하이브리드 클라우드 환경과 재해 복구 전략
등록일 2022-11-15 조회수 497

아카마이 테크놀로지스 / 김현도 이사

 

3. 하이브리드 클라우드 환경의 재해 복구 전략

하이브리드 클라우드의 통합 시스템 모니터링의 필요성은 재해 복구 시스템이 정상적으로 동작을 완료했는지의 여부와 밀접한 관련이 있다. 목표 시간내에 데이터를 완벽히 복구했다고 판단한 시점에서 온프레미스와 퍼블릭 클라우드의 데이터가 누락데이터 없는 상태로 정상 서비스를 하고 있는지를 파악해야 하기 때문이다.

정교한 재해 복구 시스템을 구축하는 것뿐만 아니라 평상시 정기적인 복구 훈련을 통해 실제 재해가 발생했을 때와 유사한 경험을 쌓는 것 역시 필요하다. 온프레미스에서 처리하던 특정 서비스를 퍼블릭 클라우드 내로 전환하는 이전하는 과정은 단순히 서비스의 요청이 클라우드로 전환되는 로드 밸린싱 기능이 동작하는 것처럼 단순하지 않다. 퍼블릭 클라우드에서 처리하던 특정 서비스를 온프레미스 환경으로 모두 이전하여 전체 서비스가 기존 상태와 동일하게 유지될 수 있는 과정이 필요하다는 의미이다. 이런 관점에서 하이브리드 클라우드 기반 서비스 상태 모니터링은 인프라와 네트워크 관점에서도 적절히 고려되어야 한다.

재해 복구 시스템을 훈련하는 과정에서 필연적으로 레거시 시스템의 재검토와 불필요하게 유지되고 있던 자원들의 효율화 과정이라는 부가적인 결과물을 얻게 된다. 이는 재해복구 시스템의 유지를 위한 과도한 인적/시간적 리소스 투입을 우려하는 기업이 가질 수 있는 장점 중 하나이다.

 

하이브리드 클라우드 환경에서의 재해 복구 시스템은 재해 시간이나 재해 시점 목표의 정확성은 통합 시스템 모니터링이 완성도에 따라 좌우된다. 높은 수준의 통합 시스템 모니터링은 가시성을 확보하고 있다는 의미가 되고, 이는 높은 수준의 보안성을 가지고 있느냐와도 연관성이 있다.

퍼블릭 클라우드는 온디멘스 형태의 구독 서비스를 제공하기 때문에 현업 서비스 부서와 보안 부서가 느슨한 형태의 협업 구조를 가지고 있거나 사업부로 분리되어 있는 경우 보안팀의 시야를 벗어난 어플리케이션이나 퍼블릭 클라우드의 기능들이 추가될 수 있다. 이러한 사각지대에 놓인 자산들은 재해 복구 시스템의 대상에 포함될 가능성도 적으며 여러 취약점 노출에 의한 보안성 약화의 원인이 되기도 한다.  하이브리드 클라우드 환경의 보안성 강화의 3대 요소로 거버넌스, 가시성, 제어를 꼽을 수 있다.

 


[그림1. 하이브리드 클라우드 보안환경 3대 요소 (출처: 파이어아이)]

 



 

4. 재해 복구 시스템과 보안성 강화, 마이크로 세그멘테이션 기법으로

 

하이브리드 클라우드 이전에도 높은 수준의 보안성을 유지하기 위해 도입되었던 전통적인 방법은 네트워크 세그멘테이션이라는 기법이었다.

 


[그림2. 네트워크 세그멘테이션 이미지 (출처: illimio)]

 

네트워크 세그멘테이션은 내부 네트워크를 필요에 따라 분류하고 이를 감시하는 내부 방화벽을 구축하여 보안 정책에 따른 트래픽의 흐름을 감시하고자 하는 목표를 가진다. 주로 활용되는 기법은 VLAN(virtual local area networks), ACL(access control lists)이었으며 단일 머신 또는 가상 머신을 기반으로 하는 서비스에서는 효율적인 구조로 인식되어 왔다. 하지만 클라우드 환경의 자동확장 기능은 필요에 따라 서비스 워크로드를 위한 자원인 인스턴스가 생성되거나 사라질 수 있다. 또한, 인프라 자원의 효율적 활용을 목표로 하는 컨테이너와 서버리스 컴퓨팅과 같은 기술들은 네트워크 세그멘테이션의 한계를 넘은 마이크로 세그멘테이션이라는 새로운 개념이 등장하는 배경이 되었다.

마이크로 세그멘테이션은 시스템상 나눌 수 있는 최소한의 단위를 기준으로 자원을 구분하고 제어한다는 개념에서부터 시작된다. 다시 말해 호스트나 네트워크 주소가 아닌 인프라 리소스에 해당하는 프로세스의 ID를 기반으로 정책과 보안을 설정할 수 있다는 의미이며 인프라와 네트워크를 통합한 모니터링 시스템으로서 내부의 트래픽의 흐름을 파악하고 필요에 따라 보안 정책을 적용할 수 있다.

재해 복구 시스템을 유지하기 위한 필수 요소 중 하나인 재해 복구 훈련에서 마이크로 세그멘테이션은 중요한 역할을 수행할 수 있다. 특정 위치의 데이터센터가 화재로 인해 완전히 차단되는 상태(Black-out)는 물론이고 온프레미스가 위치한 데이터센터에 연결된 네트워크 사업자 회선중 일부가 안전 절차를 지키지 않은 공사작업의 여파로 케이블 절체된 경우를 실제 발생상황과 동일하게 구현해낼 수 있다.

또한  특정 버전의 소프트웨어/하드웨어 시스템이 공개된 취약점으로 인해 작동이 중단되어야 하는 재해 상황을 구현할 수 있는 적절한 도구 중 하나다. 데이터센터 내의 전원 케이블이나 네트워크 라인을 강제로 절단시거나 핫스왑(Hot Swap) 구성된 디스크 어레이의 일부를 강제로 꺼내는 등의 물리적 훈련이 가능한 경우 마이크로 세그멘테이션을 이용한 훈련은 일종의 드라이런(Dry run)형태로 혼합하여 사용할 수도 있을 것이다.

마이크로 세그멘테이션이 가지는 본래의 기능과 도입시 이점은 다음과 같다.

 


[그림3. 마이크로 세그멘테이션 (출처: 가디코어)]

 
  • 가시성: 온프레미스, 프라이빗 클라우드와 퍼블릭 클라우드 기반의 인프라 환경에서 서비스용 트래픽이 아닌 어플리케이션이나 네트워크 대역, 데이터센터간 흐르는 트래픽에 대한 높은 가시성을 제공한다. 이를 통해 보안운영의 거버넌스를 가질 수 있는데 퍼블릭 클라우드는 물론이고 온프레미스와 동시에 사용하는 하이브리드 클라우드 환경에서 서비스팀보다 더 강력한 거버넌스를 가지고 있게 된다. 리소스의 분포와 통신상태를 파악함으로써 생기는 조직상 이점이 생김과 동시에 기존 도구나 툴을 완전히 대치하지 않아도 된다.
    예를 들어 특정 어플리케이션의 웹서버와 로드밸런서, 데이터베이스 그룹들이 서로 어떤 네트워크 포트로 통신하고 있으며 공통 서비스를 위한 모듈 서비스의 현황 역시 파악할 수 있게 된다.
  • 제어성: 가시성을 통해 얻게 된 시스템의 트래픽 흐름과 연계정보를 이용하여 해당 스냅샷을 기준으로 보안 정책을 생성하고 관리할 수 있다. 시스템내 구동되는 어플리케이션들을 하나씩 파악하고 구분할 필요없이 시스템 정보를 태그 형태로 수집하여 자동화 처리를 통해 기본 운영이 가능한 수준까지 보안 템플릿을 생성할 수 있다.
    이러한 과정을 통해 기존 탐지 시스템에 비해 더 낮은 수준의 오탐율 리포트를 제공함으로써 보안 운영에 쓰이는 인적/물적 자원을 효율화 할 수 있다. 정해져있는 정책을 벗어나는 내부 트래픽들의 감지는 보안관리자가 감지하지 못한 위협을 파악하고 피해를 예방하는데 중요한 역할을 한다.
    적절한 내부 제어가 가능한 환경은 제로 트러스트 네트워크 아키텍쳐의 개념과 유사한 면도 있다. 제로트러스트 아키텍쳐 내부의 모든 접속을 확인하고 제어하기 때문에 서비스 트래픽은 North to South트래픽이 아닌 East to West트래픽의 가시성과 제어를 가능하게 만들어주는 장점이 있다.
 


[그림4. 마이크로 세그멘테이션을 통한 보안 정책 배포]

 
  • 거버넌스: 도입과 운영 측면에서는 가능한 자동화되어 있는 시스템을 적용하는 것이 필요하다. 보안정책 적용은 어플리케이션의 담당자나 네트워크, 시스템 운영부서 쪽의 협조 없이도 판단하고 적용 가능해야 한다. 보안 정책은 반복가능하며, 최신현황 파악이나 업데이트에 있어서 사람의 개입이나 승인 없이 자동화로 이루어져야 하며 이를 가능케 하는 환경을 구축하는 것이 필수다.
    2022년 말 log4j의 취약점 대응과정에서 보안팀이 해당 라이브러리를 사용하는 어플리케이션들의 정보를 파악하고 필요한 대응을 독자적으로 수행한 사례는 많지 않을 것이다. 일반적으로 보안팀은 필요에 따라 시스템 운영팀에게 현황을 요청하고 그에 따른 대응을 수행한 뒤 결과물을 공유해달라는 업무 흐름을 갖고 있는데, 명확히 요청한 사항이 수행되었는지 현재 운영중인 시스템의 보안 안전척도를 확신하기에는 불분명한 영역이 존재한다.
 

이처럼 하이브리드 클라우드 환경에서의 재해 복구 시스템 전략을 살펴보았다. 사일로 형태의 구성이 아닌 하이브리드 클라우드 환경이 가져다주는 많은 장점이 있지만 그에 따른 복잡도의 증가나 운영의 어려움 수준 역시 비례해서 증가하며 재해 복구 시스템의 운영의 복잡도 역시 증가한다.

그러므로 하이브리드 클라우드 환경에서의 가시성과 제어에 관한 기준을 마련하고, 적정수준에 맞는 재해 복구 시스템의 지표를 설정해두는 것이 가장 중요한 요소이다. 조직에서 감당할 수 있는 재해복구 시스템 투자 비용에 따라 결정되는 재해 복구 시간과 재해 복구 목표값은 서비스의 중요도와 회복 탄력성을 수치로 정의할 수 있는 기업 의사결정이 필요하다.

 



저작권 정책

K-ICT 클라우드혁신센터의 저작물인 『하이브리드 클라우드 환경과 재해 복구 전략』은 K-ICT 클라우드혁신센터에서 아카마이 테크놀로지스 김현도 이사에게 집필 자문을 받아 발행한 전문정보 브리프로, K-ICT 클라우드혁신센터의 저작권정책에 따라 이용할 수 있습니다.
다만 사진, 이미지, 인용자료 등 제3자에게 저작권이 있는 경우 원저작권자가 정한 바에 따릅니다.