JUST WRITE

What is Redshift? 본문

Cloud

What is Redshift?

천재보단범재 2022. 2. 15. 18:48

What is Redshift?

AWS Redshift는 Amazon Web Service중에 Data Warehousing을 지원하는 솔루션이다.

페타바이트(10^15bytes)급의 대용량 데이터를 처리할수 있다.

큰 Scale의 Data를 Migration할 수 있다.

AWS Interface를 통해 손쉽게 새 Cluster를 구성할 수 있다.

특징

  • OLAP 형태의 Column 기반 Database
  • PostgreSQL(Version 8.0.2) 기반 -> SQL Query 사용 가능
  • MPP(Massively Parallel Processing)를 통한 Fast Querying 제공
    • 다수의 Computing 노드가 병렬로 작동하여 Query 처리
    • 각 노드는 할당된 Data에 대해서 동일한 Query 처리
    • Query Optimizer MPP 특징을 활용하여 최적의 Query 실행

  • Data 암호화 제공으로 보안 강화
    • Snapshot의 Data Block과 System Metadata까지 암호화 진행
  • Data 압축
    • Data 압축을 통해서 크기 줄임
    • Data Type에 따른 다양한 압축 유형 제공
  • Data API 제공 -> Python으로 접근 가능
  • 정기적인 Backup 제공
  • 다양한 출력 Format 제공 -> 일반적으로 Apache Parquet, ORC(Optimized Row Columnar) 파일
  • 자동 Scaling 제공
  • AWS Integration

제한점

  • 제한적인 Database와의 병렬 Upload
    • Amazon S3, EMR, DynamoDB에서 MPP를 통한 병렬 Upload 제공
  • Data Unqiuess
    • 다른 DataSource에서 Mirgration한 경우 Unqiue 보장 못함
  • 특수한 Indexing
    • 분산 키, 정렬 키를 통해서 index 작업 진행
  • OLAP Performance 제한
    • OLTP보다 떨어지는 Performance(Insert, Update, Delete)

[참고사이트]

728x90
반응형
Comments