아직도 많은 사람들이 USB 드라이브에 들어 있는 플래시 스토리지와 데이터 센터에 사용되는 플래시가 같은 것이라고 오해하고 있다. 그러나 실제로 이 둘은 매우 다르다. 기업용 플래시에 대해 꼭 알아 두어야 하는 다섯 가지 사실을 아래에서 확인할 수 있다.

플래시 스토리지에 대해서는 많은 오해와 억측이 난무하고 있다. 누구나 한 번은 플래시 메모리가 내장된 장치/디바이스를 사용해 본 적이 있을 것이다. 플래시는 오늘날 우리 주변의 웨어러블, 스마트폰, 태블릿 등 다양한 기기 내에 존재한다. 그러나 이들은 대부분 기업용 등급의 플래시 기술과는 매우 큰 차이를 지니고 있다. 

사람들이 흔히 플래시 스토리지 하면 가장 먼저 떠올리는 것이 바로 USB 플래시 드라이브 일 것이다(이 역시 샌디스크에서 세계 최초로 개발했다.) 기업의 소중한 데이터를 일반 소비자용 제품에 저장하고자 하는 기업은 없을 것이다. 기업용 플래시 장치는 일반 소비자용 플래시와는 완전히 별개의 제품이다. 

이들은 모두 나름의 필요와 사용 방식에 맞추어 용량, 성능, 신뢰성, 비용 등에 있어 차이를 보인다. 

이 글에서는 샌디스크의 기업용 플래시 스토리지의 설계와 제조 방식에 대해 살펴보고 이를 통해 왜 데이터 센터의 SSD와 일반 USB 드라이브가 완전히 별개의 제품인지를 알아보도록 하겠다.

 

◇데이터 보호 기능  
기업용으로 설계된 장치는 가능한 모든 수단과 최신의 기술을 사용해 고객의 데이터를 안전하게 보호하지 않으면 안 된다. 

엔드투엔트 데이터 보호(end toend date protection)라 함은 특정 기기로 유입되어 그 내부를 통과하는 데이터가 손상되거나, 다수의 비트 플리핑(bit flipping)에 의해 예상치 못한 변화나 의도하지 않은 변동이 발생하는 것을 막는다는 것을 의미한다.

이러한 비트 플리핑 현상은 모든 전자 기기에서 발생할 수 있다. 알파 입자부터 대기 중에 존재하는 전기 노이즈, 배경 복사에서 장치 신호 품질에 이르기까지 다양한 원인으로 인해 비트의 플립 현상이 발생하고, 이 때문에 데이터가 손상 혹은 복구 불가능한 사태로 이어질 수가 있다. 

데이터가 플래시 장비를 통과하는 동안 칩에서 칩으로 데이터가 옮겨 다니게 된다. 이러한 과정에서, 전기 신호가 칩과 칩 사이를 건너가는 도중 외부에 노출되게 된다. 샌디스크가 제공하는 기업용 플래시 드라이브는 ECC(Error Correcting Code: 오류 정정 코드) 또는 LDPC(Low Density Parity Check: 저밀도 패리티 체크)라는 기능을 통해 데이터를 확인하는 과정을 거친다. 

이러한 과정은 추가적인 패리티 데이터를 원본 데이터 패킷과 함께 통과시키는 방법을 통해 구현되며, 이를 통하여 데이터가 칩에서 칩으로 넘어가는 과정에서 비트 플리핑이 발생하지는 않았는지를 검증한다. 

비트 플리핑이 발생하는 경우 데이터 이동 후 다음 칩에서 부정확한 데이터를 넘겨 받게 되고, 이러한 부정확한 데이터가 드라이브에 쓰여지거나 다른 애플리케이션으로 넘어가는 최악의 상황이 발생된다. 이러한 과정은 매체로 이어지는 경로에서뿐 아니라, 기기 내 DRAM/SRAM과 이어지는 경로 상에서도 이루어진다. 그렇게 때문에, ‘전 과정(엔드투엔드)’에 걸친 데이터 보호는 기업환경에서 가장 중요한 부분이기도 하다.   

 

◇정전 보호 기능  
정전 보호 기능(Power Fail Protection)은 경우에 따라 PFail 기능으로도 불린다. PFail 기능의 목적은 데이터를 전송하는 도중 예기치 못한 전력 차단이 발생하는 사태로부터 사용자의 데이터를 보호하는 것이다. 최종 매체에 쓰는 과정이 진행 중인 경우, 쓰기가 시작되기 직전 기기는 쓰기 확정 명령(write commit)을 호스트로 전송한다. 일부 경우에서는 SRAM이나 DRAM을 전방 버퍼로 사용하여 드라이브에 대한 추가적인 쓰기 성능을 제공하기도 한다. 

기기에 PFail 기능이 구현되지 않는 경우 데이터를 SRAM이나 DRAM 상에 커밋(commit) 하거나, 최종 매체로 전달하는 과정에서 전력 장애가 발생할 때 쓰기 데이터가 최종 매체에 결과적으로 도달하지 못하는 사태가 일어날 수 있다.

이와 같은 경우 데이터는 당연히 손실되거나, 업데이트 되지 못한 과거 버전의 데이터가 그대로 남아 있는 사태가 발생할 수가 있다. 1백만달러를 입금해야 하는 상황에서 정전 한 번으로 데이터가 최종 매체에 기록되지 않는 사태가 발생하는 것을 원하는 사람은 없을 것이다. 

샌디스크의 기업용 기기/디바이스는 커패시턴스(축전기)를 사용해 데이터를 최종 매체로 전송하는 데에 충분한 전력을 확보하여, 커밋된 쓰기를 완수할 수 있도록 하거나, 호스트에 커밋하기 전에 정전이 이루어지더라도 데이터가 기기 내 최종 저장 매체에 반드시 전달될 수 있는 위치에 도달하기 전까지는 쓰기 확정 명령을 발생시키지 않는 방식을 취하고 있다. 


 
◇기기 과열 방지 기능 
스토리지 기기 및 장치는 데이터를 쓰거나 읽는 과정에서 열을 발생시킨다. 이는 실질적인 작업을 수행하는 모든 다른 기기와 마찬가지이다. 플래시의 경우 서버 전방에 위치한 표준 드라이브 베이, 즉 PCIe 베이나 M.2 폼팩터와 같은 다른 내부 슬롯 등에서 사용이 이루어지므로 자체적으로 발생하는 열 뿐 아니라 상위에 위치하는 장치로부터 발생하는 열에도 노출되며 데이터 센터 내부의 온도 변화, 서버 위치 등 환경적 온도 변화에도 영향을 받는다. 

서버의 작동 시간(uptime)을 극대화시키기 위한 노력의 일환으로 샌디스크에서는 드라이브의 발열로 인한 기기 과열 및 장애를 일으키는 요소를 제거하는데 최적화 되어 있다.  

샌디스크의 기기는 자체적으로 발열 상태를 감시하며, 과열로 인해 고객 데이터의 안전이 우려되는 상황, 또는 플래시 미디어에 열 손상이 우려되는 상황에서는 기기의 작동에 제약, 즉 쓰로틀링(throttling)을 가한다. 

기기 성능에 쓰로틀링(throttling)을 거는 방법은 기기에서 발생하는 열을 줄여 주는 지능적인 방식으로, 이를 통해 기기의 작동 온도를 낮추어주고, 실제로 CPU 등 다른 상위 장비에서 발생하는 열이 원인이 되는 상황에서도 데이터의 보호가 이루어지도록 해 준다. 

쓰로틀링(throttling)은 외부에서 발생하는 열이 일정 한계를 넘어서, 보드 상의 NAND가 감당할 수 있는 수준을 넘어서는 경우에는 대처하지 못한다. 이는 플래시 디바이스에 가스 토치를 들이 대는 경우 아무리 내부적으로 쓰로틀링(throttling)을 하더라도 칩이 녹아버리는 것과 같은 이치이다. 

 

◇성능 확보를 위한 서비스 품질 
서비스 품질, 또는 QoS라 함은 고객을 대상으로 항상 일정 수준 이상의 성능이 제공될 수 있도록 샌디스크가 기업용 기기에 설정하는 사양 기준이다. 샌디스크가 지정하고 있는 QoS 사양은 다음과 같다.

최대 읽기 지연 시간 - 99.99%의 비율로 < 50usec 유지 (QD1)
최대 쓰기 지연 시간 - 99.99%의 비율로 <100usec 유지 (QD1)

단 클라이언트 기기는 QoS 사양을 제공하지 않는다. 여기서 말하는 99.99% 비율 기준은 기업용 품질 기준이며, 실질적으로 다수의 경쟁사 기업용 SSD에 비해 높은 수준에 해당한다. 경쟁사의 경우, SSD 품질 사양 기준을 99.9%로 제한하고 있다. 경쟁사들 역시 클라이언트 기기를 대상으로는 이러한 사양 기준을 제시하지 않고 있다. 

샌디스크의 SSD는 성능 관련 사양 목표치로부터 +/-5%를 벗어나지 않도록 모든 작업 부하에 대해 성능 안정성을 보증하고 있다. 클라이언트 장비/기기는 일반적으로 이러한 보증을 제시하지 않으므로 안정성에 대한 신뢰성의 차이가 발생 하는 경우가 있다. 

 

◇수정 불가능한 비트 에러율 
수정 불가능한 비트 에러율(Uncorrectable Bit Error Rates)은 통상 UBER로 표기하는데, 이는 매체에 필요로 하는 데이터 접근이 이뤄지지 못하는 경우의 비율을 말한다. 클라이언트 기반 기기는 대략 10-15의 비율을 보인다.

이에 반해 기업용 HDD의 비율은 10-16을 나타낸다. 기업용 SSD는 약 10-17의 비율을 보이는데, 이것은 클라이언트 디바이스에 비해, 기업용 SSD의 데이터 손실률이 100배 더 낮으며, 기업용 하드 드라이브보다는 10배 낮다는 것을 의미한다.

샌디스크의 CloudSpeed 기업용 SSD 제품군은 실제로 UBER이 1018에 달하며, 이러한 기기는 기업용 HDD에 비해 데이터 손실율이 100배 더 낮다.

또한 Fusion ioMemory PCIe 애플리케이션 엑셀러레이터의 경우, UBER이 1020에 이를 정도로 높으며, Fusion ioMemory PCIe 플래시 기기의 UBER의 경우, 일반 소비자용의 SSD에 비해 비트 데이터 손실률이 100,000배 낮고, 기업용 하드드라이브(HDD)에 비해서는 데이터 손실률은 10,000 배 낮은 수준이다.

또한 샌디스크의 CloudSpeed Gen II. SSD의 경우, 기업용 장비 중 업계 내 현존하는 어떤 경쟁사 제품보다도 우수한 UBER 성능을 보장한다. 

플래시 드라이브는 소비자용 USB 드라이브에나 적합한 제품이라고 생각하는 사람이 있다면 이 글을 통해 소비자용 제품과 기업용 플래시 제품에 대한 올바른 이해를 하는 계기가 되었기를 바란다. 또한 데이터 센터 스토리지의 속도 향상을 고민 중인 기업이라면 향후 최적의 스토리지 제품을 선택하는 데 이해하는 도움이 되길 바란다. 

 

글 : 애덤 로버츠(Adam Roberts) / 데이터센터 솔루션즈 수석 아키텍트 / 샌디스크
자료제공 : 샌디스크코리아 <www.sandisk.co.kr>

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지