2021. 9. 22. 20:15ㆍ잡다한 IT/개발자도 궁금한 IT인프라
스토리지의 활용성은 어떤 목적으로 데이터를 활용하도록 하는가에 대한 방식의 문제이다. 스토리지가 제공하는 복제 솔루션(원본과 같은 데이터를 복제하는 방식인 내부 복제, 원본과 다른 곳에 있는 스토리지로 같은 데이터를 복제하는 외부 복제)의 제공여부로 확인할 수 있다. 기술의 발전에 따라 실시간 복제도 가능하다.
내부 복제는 주로 데이터 백업 등을 위해 활용되며 실시간 복제보다 특정 시점에 대한 복제를 위해서 사용한다. 원본 데이터를 즉시 복구시키기 위함이다. 테스트를 하거나 데이터 초기화를 위해서도 사용하기도 한다. 테이프 등의 별도 백업도 있지만 스토리지보다 관리요소가 많아서 주로 내부 복제를 활용하다.
외부 복제는 동기/비동기 방식으로 나누어서 복제를 하지만 주로 비동기 방식으로 많이 사용한다. 특히 재해 복구용으로서 사용을 하며 DB센터의 물리적인 위협을 제거하기 위해서 사용한다.
디스크 성능 지표는 IOPS와 처리량, 응답 시간에 따라 분석할 수 있다. 먼저 IOPS를 기준으로 삼으면 생산 목적에 맞게 스토리지는 IOPS를 얼마나 높게, 잘 처리할 수 있는가에 따라 좋은 스토리지인지 아닌지 가 나뉘게 된다. 스토리지 IOPS는 특히 스토리지 사용량에 대한 추이를 분석할 때 가장 먼저 확인하게 되는 항목이다. 보통 I/O의 크기가 클수록 이를 처리하기 위한 스토리지 응답 시간이 늘어나며 자연스럽게 IOPS는 줄게된다. 일반적으로 하드디스크는 7,200rpm, 15,000rpm등의 분당 회전수를 가지고 있으며 이로 인해 1초당 처리할 수 있는 횟수가 정해저 있다. 최근의 경우 SSD의 가격이 많이 하락하여 굳이 HDD를 추가하지는 않는다.
처리량(MB/s)을 기준으로 삼는다면,
온라인 업무와 달리 백업 또는 배치 업무는 상대적으로 블록의 크기가 크며 시퀸셜(sequential)하게 디스크에 접근하는 경우가 일반적이며 배치는 수행시간이 관건이기에 단위 시간당 처리량이 중요하다. 이런 IOPS나 처리량은 스토리지 사양이나 HDD 종류, I/O 블록 사이즈, 서버 스레드 개수 등의 변수에 따라 성능 차이가 다르게 나 수 있다.
응답시간을 기준으로 삼는다면 서버와 연결되는 스토리지 컨트롤러의 포트에서 나타나는 응답 시간을 기준으로 잡는다. 서버의 HBA에서 요청해서 스토리지의 컨트롤러의 포트까지 왕복하는데 걸리는 시간을 의미한다. 에플리케이션 입장에서는 응답시간이 중요하기에 온라인 업무의 5~6ms 응답 시간을 목표로 두고 있다.
CWP비율(cache write pending)이라는 것 이 있다. 일반적인 상황에서 캐시에 쓰기를 할 때 1ms이하로 처리되는게 정상적인 상황이지만 디스크가 다른 작업으로 인해 사용할 수 없어서 즉시 처리되지 못하고 지연되는 비율을 의미한다. 보통 30%를 초과하게 된다면 캐시의 데이터를 디스크로 강제로 내리게 되면서 쓰기 응답 시간이 1ms를 넘어가게 된다고 한다.
'잡다한 IT > 개발자도 궁금한 IT인프라' 카테고리의 다른 글
클라우드를 도와주는 오픈소스 OpenStack(오픈스텍) (0) | 2022.02.04 |
---|---|
IT인프라를 서비스로 만드는 클라우드 (0) | 2022.02.03 |
Storage의 구성요소 part.2(RAID란?) (0) | 2021.09.21 |
Storage의 구성요소 part.1(스토리지의 개념과 구성요소) (0) | 2021.09.21 |
X86, 그리고 CPU (0) | 2021.08.11 |