Amazon S3 part.2
S3는 저장용량이 엄청나게 큰 만큼 데이터 분석을 위한 연산 및 대규모 분석용{Data Lake(데이터 호수)} 데이터 스토어에 주로 사용한다. 주로 금용 거래 분석, 클릭스트림 분석, 미디어 트랜스코딩등의 처리를 한다. Data Lake(데이터 호수) = 여러 곳에서 데이터가 흘러 들어와서 한 곳에 모이는것을 의미한다. 우선 한 곳에 모든 데이터를 모은 후 필요한 데이터를 ETL과정을 거친다.{추출(Extract), 변환(Transform), 적재(Load)의 과정} 데이터의 저장 및 관리를 하기 위해 중앙 집중식으로 편리하게 사용하기 위함이다. 이것을 만들때 온프레미스 환경에서 가장 큰 고민은 얼마만큼의 저장공간을 확보해야하는지에 대해 고민하고 이 고민은 결국 부담이 되는데 S3의 경우 용량 제한이 ..
2021.09.06