자료실

백업과 아카이브의 공통점과 차이점 살펴보기 – 2부


Quick Overview 

백업과 아카이브는 데이터를 장기간 저장하고 여러 복사본을 보관한다는 점은 같지만 비즈니스 목적, 데이터 업데이트 및 검색 빈도를 고려하고 적합한 방법을 선택해야 합니다. 여기서는 백업과 아카이브를 위한 최적의 스토리지 미디어와 티어, 저장할 데이터의 범위 등 백업 및 아카이브 시 고려해야 할 사항을 살펴봅니다. 



데이터를 보호하고 보존하는 접근 방식은 백업과 아카이브 2가지로 나뉩니다. 
‘백업과 아카이브의 공통점과 차이점 살펴보기 – 1부’에서는 백업 혹은 아카이브의 필요성을 결정하는 방법을 알아보았습니다. 어떤 방법을 선택하든 기록을 위해 무언가를 저장하려면 30년 후에도 여전히 읽을 수 있는 파일 형식과 스토리지 미디어가 무엇일지 생각해야 합니다. 여기서는 백업과 아카이브를 위한 최적의 스토리지 미디어와 티어, 그리고 불변성 백업과 아카이브의 차이점을 알아봅니다.  


백업과 아카이브를 위한 최적의 스토리지 미디어 

데이터를 어디에 쓰나요? 어느 유형의 미디어에 쓰나요? 

 

테이프는 한때 백업과 아카이브, 두 영역에서 가장 많이 사용되는 미디어였습니다. 그 결과 간단한 백업 소프트웨어를 아카이빙 툴로 사용하는 경우가 많았습니다. 백업이든 아카이브든 결국 데이터가 향하는 곳은 테이프였기 때문입니다. 그러나 지금은 선택지가 더 많습니다. 테이프에 저장할 수도 있고, 자체 데이터센터 또는 클라우드의 디스크(즉, 다른 누군가의 데이터센터에 있는 디스크)에 저장할 수도 있습니다. 

 

간단히 말하면 백업“빠른 액세스”, 즉 “더 고가의 스토리지”를 의미하고 아카이브는 “느린 액세스”, 즉 “상대적으로 저렴한 스토리지”를 의미합니다.  

 

백업을 위한 스토리지 옵션 

백업은 높은 빈도로 수행되며, 복구에는 빠른 속도가 필요합니다. 즉, 대부분 대기업에서는 테이프에 곧바로 백업하는 것이 더 이상 최선의 선택이 아닙니다.  

 

왜 그럴까요? 테이프는 일반적으로 금고에 보관됩니다. 누군가는 그 테이프를 찾아서 로드한 다음 데이터를 찾아서 불러와야 합니다. 이처럼 많은 단계를 거치는 테이프는 빠른 액세스가 불가능합니다. 

 

오늘날의 백업은 디스크 또는 클라우드가 더 적합합니다. 다만 클라우드에서 복원하는 경우 로컬 데이터센터의 디스크에서 복원하는 것보다는 속도가 느릴 수 있습니다. 어쨌든 RTO(Recovery Time Objective)가 더 길어져도 괜찮다면 클라우드도 좋은 선택입니다. 


아카이브를 위한 스토리지 옵션 

아카이브에서는 보통 비용이 첫 번째 고려 사항입니다. 아카이빙하고자 하는 데이터의 양이 얼마나 되나요? 로컬 디스크 또는 클라우드에 대용량 아카이브를 저장할 경우 비용이 상당히 높아질 수 있습니다. 그러나 아카이브에서 불러오는 속도가 느려도 상관없다면 액세스 속도를 희생하는 대신 스토리지 비용을 절감할 수 있습니다. 여기서 테이프가 다시 고려 대상이 됩니다. 수작업이 더 많이 필요하긴 하지만, 아카이브 용도로는 실용적인 방법입니다. 

 

클라우드 서비스 제공업체(하이퍼스케일러)는 아카이브를 위한 저비용 스토리지 옵션을 제공합니다. 왜 저렴할까요? 얼핏 클라우드 기반 디스크에 저장되는 것처럼 보일 수 있지만, 사실 대부분의 경우 디스크 캐시에 저장되었다가 이후 테이프로 전달되는 형태이기 때문입니다. 첫 번째 바이트까지의 시간(Time to First Byte, TTFB)은 4~8시간입니다. 과거 정보에 대해 이 정도의 불러오기 시간을 용납할 수 있다면 클라우드 아카이브가 적합합니다. 

 


최적의 스토리지 티어 : 핫, 콜드, 그리고 아카이브 

클라우드 스토리지 옵션을 선택했다면 그다음에는 스토리지 티어와 ‘온도’를 결정해야 합니다. 

 

클라우드로 데이터를 보내기 전에 데이터에 적용할 서비스 수준(일반적으로 핫, 콜드 또는 아카이브로 나뉨)을 클라우드 제공업체에 알려줘야 합니다. 업체는 이를 통해 데이터를 빠른(값비싼) 디스크에 저장할지, 느린(저렴한) 디스크에 저장할지, 또는 테이프(가장 저렴)에 저장할지 결정합니다. 여기서 “사용자가 그 데이터를 불러와야 하는 빈도 또는 가능성은 어느 정도인가?”를 다시 되짚어봐야 합니다. 

 

일반적인 시나리오로, 클라우드에 저장하기로 결정하고 핫 스토리지 티어로 시작하는 경우를 가정해 보겠습니다. 


  • 제공업체는 데이터에 대해 사용자가 원하는 만큼 자주 액세스할 수 있도록 허용합니다. 그러나 즉각적인 액세스를 위해 가장 높은 가격(100%)을 지불해야 합니다. 

  • 향후 30일 이내에 데이터에 액세스하지 않으면 제공업체는 해당 데이터를 업체와 고객 모두에게 더 저렴한 콜드 티어로 옮길 수 있습니다. 액세스 속도는 느리지만 액세스 빈도 역시 낮습니다. 비용은 핫 티어 요금의 50%입니다. 

  • 사용자가 해당 데이터에 30일 이내에 액세스하는 경우 제공업체는 데이터 티어를 100% 요금의 핫 티어로 다시 변경합니다. 


아카이브 티어의 일반적인 시나리오는 다음과 같습니다. 

 

  • 아무도 데이터에 액세스하지 않으면 최종적으로 제공업체에서 데이터를 아카이브로 옮깁니다. 

  • 180일 동안 데이터에 액세스하지 않으면 제공업체에서 아카이브 요금(30%)을 청구합니다. 

  • 180일 이내에 누군가가 데이터에 액세스하면 제공업체는 아카이브(테이프)에서 데이터를 불러와야 합니다. 데이터가 아카이브 미디어에 저장되어 있다 해도 업체는 다시 콜드 티어 요금(50%)을 청구합니다. 

 

데이터 스토리지 비용을 지불하는 것은 여러분이므로 스토리지 티어를 잘 이해해야 합니다. 또한 사용자가 ‘아카이브’라는 단어를 어떻게 이해하고 있는지에 대해서도 신중하게 생각해야 합니다. 


몇 년 전의 데이터를 ‘아카이브’라고 부른다고 가정해 보겠습니다. 몇 년 전 데이터를 아카이브 티어에 저장하는 것이 합리적이란 생각이 들지 않을까요? 가장 비용 효율적인 최선의 티어일 것입니다. 하지만 사용자가 아카이브를 자유롭게 검색할 수 있기를 원한다고 가정해 보겠습니다. 이 경우에는 사용자가 지속적으로 데이터를 불러올 것이므로 아카이브 티어에 저장하지 않을 것입니다. 일반 프로덕션 데이터처럼 액세스할 것이니 클라우드 제공업체는 가장 높은 요금을 청구하게 됩니다. 


요약하자면, 사용자가 향후 30일 이내에 데이터를 불러와야 할 가능성이 얼마나 되는지 알고 있다면 사용에 맞는 최적의 티어를 선택할 수 있습니다. 엄밀히 말해 액세스할 일이 없는 아카이브 역시 마찬가지입니다. 아카이브는 매우 장기간 보관되며 변경할 수 없습니다. 

 

여기서 이어지는 주제가 바로 불변성입니다. 


불변성과 백업과 아카이브의 차이 

백업의 주된 목적은 데이터 손실에서 기업을 보호하고 손실이 발생할 때 복구하기 위한 것임을 상기해 보십시오. 가장 큰 위험은 백업 데이터가 랜섬웨어에 의해 손상돼 아무것도 복원할 수 없게 되는 상황입니다. 불변성 백업은 일단 생성되면 랜섬웨어를 포함한 그 무엇으로도 변경할 수 없습니다. 이런 면에서는 백업과 아카이브가 비슷합니다. 모두 원치 않는 변경 또는 삭제에서 데이터를 보호합니다.  

 

백업과 아카이브는 변경 속도에 큰 차이가 있습니다. 짧은 RTO의 경우 매시간 또는 매일 변경 사항을 캡처해야 하므로 백업의 변경 속도가 훨씬 더 빠릅니다. 중단 후 운영을 재개하기 위해서는 변경 사항을 자주 캡처해야 하므로 백업의 변경 속도가 높아야 합니다. 또한 유효 기간이 지난 파일이 스토리지를 과도하게 점유하지 않도록 하기 위해 소프트웨어에서 정기적으로 백업 세트를 정리할 수 있어야 합니다. 

 


반면 아카이브의 경우 변경 속도가 0에 근접합니다. 아카이브는 장기간 보관하고자 하는 데이터를 의미하므로 한 번 저장하면 그것으로 끝입니다. 간혹 아카이브에 데이터를 추가하지만 일반적인 상황에서는 수정하거나 삭제할 일이 거의 없습니다. 파일에는 유효 기간이 없으므로 아카이브는 정리할 필요가 없습니다. 


데이터 범위 : 백업 또는 아카이브하는 데이터 

아카이브와 백업의 또 다른 큰 차이점은 각각에 포함되는 데이터의 범위입니다. 이는 데이터를 적절한 목적지로 보내기 위한 워크플로우까지 확장됩니다. 

 

아카이브의 경우 기록을 위해 데이터를 보관하므로 일반적으로 간단합니다. 아카이빙 정책에 따라 완료된 프로젝트(소프트웨어 개발, 마케팅 콘텐츠, 건축 도면 등)를 한 달에 한 번씩 검토하고 불변성으로 저장해야 할 수 있습니다. 프로젝트 관리적 사고방식을 적용해서 유한한, 마감된 작업을 특정 위치에 보관하고 그 작업에 대해 완전히 잊을 수 있습니다. 

 

백업의 경우 현재 진행형이라는 사고방식을 적용해야 하므로 워크플로우도 다릅니다. 프로덕션은 지속적이고 프로젝트는 현재 진행 중이며, 무엇보다 커뮤니케이션이 비구조적입니다. 사실 정보의 가장 큰 문제는 정보가 구조화되지 않은 경우입니다.  

 

모양과 형태를 인식할 수 있는 데이터, 즉 데이터베이스의 레코드, 스프레드시트의 셀, XML의 텍스트 등은 구조적입니다. 반면 비디오의 대화와 텍스트, 프레젠테이션의 글머리 기호, 웹 페이지 등은 모양과 형태가 없는 비구조적 데이터입니다. 백업과 아카이브에서는 비구조적 데이터에 대해 신중하게 생각해야 합니다. 어떤 비구조적 데이터를 보호해야 하나요? 모든 법적 문제에 대처하려면 그 데이터를 얼마나 오래 보존해야 하나요? 


이메일 – 특수한 경우 

이메일은 비구조적입니다. 그렇다면 누군가가 특정 제품에 대해 특정한 사람과 중요한 대화를 나눌 때 어떻게 알 수 있을까요? 알 수 없습니다. 구조가 없기 때문에 해당 계정에 로그인해서 메일함을 살펴보는 것 외에는 대화를 찾을 방법이 없습니다. 

 

뉴스에서는 이메일 보존의 중요성을 비롯해 법적 증거 개시 절차에서 이메일이 갖는 가치를 자주 언급합니다. 여러분의 비즈니스 및 영업 서신 맥락에서 이에 대해 생각해 보십시오. 웹 기반 고객 관계 관리(Customer Relationship Management, CRM) 소프트웨어를 사용해 잠재 고객을 위한 견적을 생성한 다음 이 견적의 PDF를 이메일을 통해 보냅니다. CRM 데이터 백업은 CRM 솔루션 업체의 책임이므로 여러분이 직접 백업하지 않습니다. 그러나 해당 솔루션 업체에서 데이터가 손실되거나 랜섬웨어 공격이 발생해 견적이 사라진다고 가정해 보십시오. 여러분이 보낸 이메일과 첨부파일이 갑자기 중요해집니다. 

 

직접 보호할 수 없는 CRM 데이터와 별개로 이 정보의 자체 기록을 보호하려면 송수신 이메일을 백업해야 합니다. 백업할 수는 있지만, 이 경우에도 여전히 비구조적 데이터라는 문제에 직면하게 됩니다. 


다음 문제는 이메일, 그리고 모든 비구조적 데이터에 대한 현실적인 백업 빈도 설정입니다. 이게 왜 문제일까요? 일부 사용자는 때로는 실수로, 때로는 의도적으로 이메일 메시지를 삭제하기 때문입니다. 회사를 완전히 보호하기 위해서는 많은 기록을 보관해야 합니다. 이 말은 즉, 위에서 언급한 높은 변경 속도로 인한 높은 빈도의 백업을 의미합니다. 야간에만 백업한다면 사용자가 아침에 뭔가를 전송하고 점심에 삭제할 경우 사본을 확보할 수 없습니다. 이 때문에 비구조적 데이터는 백업과 아카이브에 대해 생각할 때 고려해야 하는 골치 아픈 문제입니다. 

 


결론 

요약하면, 아카이브 및 백업을 다룰 때 던져야 할 올바른 질문은 “무엇을 달성하고자 하는가?”입니다. 우선순위와 제한 사항을 기재한 간단한 스프레드시트를 만든 다음 무엇이 적합할지를 판단하십시오. 이 기능이 백업에 적합한지, 아카이빙 환경에 적합한지 자문하십시오. 그런 다음 기존 백업 환경으로 요구사항을 충족할 수 있는지, 또는 적절한 아카이빙 시스템에 투자해야 하는지 결정하십시오. 


중요한 점은 기술이 아닌 비즈니스 맥락에서 백업과 아카이브 문제를 평가해야 한다는 것입니다. 백업과 아카이브는 다양한 유형의 회사 데이터에 대한 서비스 수준 계약을 설정하는 프로세스의 일부여야 합니다. 구매할 시스템을 결정할 때 IT 부서가 개입하는 것은 좋은 생각이지만, 무엇을 아카이브하고 백업할지에 대한 기본적인 의사 결정을 IT 부서가 내리는 것이 항상 좋은 것만은 아닙니다. 이런 의사 결정이 기업에 미치는 잠재적인 영향을 고려해서 비즈니스 관리자가 결정을 내려야 합니다. 


데이터 백업 혹은 백업 데이터 관리에 어려움을 겪고 계시거나 궁금한 점이 있으시면 언제든 퀘스트소프트웨어코리아로 문의주시기 바랍니다.  




퀘스트소프트웨어코리아(주)

서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600

전자 메일 KoreaMarketing@quest.com 


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB


퀘스트소프트웨어코리아(주) 서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600 | 전자 메일 KoreaMarketing@quest.com


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB