오늘 포스팅에서는 데이터웨어하우스의 특징에 대해 살펴보도록 하겠습니다. 데이터 웨어하우스의 특성은 업무 시스템의 데이터베이스 및 스토리지 시스템과 구별됩니다. 데이터 웨어하우스의 주요 특징은 알아보도록 하겠습니다.
주제 지향적(Subject-Oriented)
데이터 웨어하우스는 주제 지향적입니다. 즉, 판매, 재무 또는 고객 데이터와 같은 특정 비즈니스 주제나 영역에 중심으로 분류합니다. 데이터는 이러한 주제와 관련된 분석 및 보고를 지원하도록 구성되고 최적화됩니다. 그림처럼 관심영역 별로 데이터를 조합해 분석 관점의 DW 만의 주제영역을 만듭니다.
통합적(Integrated)
데이터 통합은 데이터 웨어하우스의 중요한 특성입니다. 운영 데이터베이스, 외부 데이터, 플랫 파일 등 다양한 소스의 데이터를 통일되고 일관된 형식으로 통합합니다. 통합을 통해 다양한 시스템의 데이터를 함께 분석할 수 있습니다. 아래 예시처럼 각각의 원천 시스템에서 들어온 데이터들의 값들을 통합하는 작업을 수행합니다. 특히 코드 값에 대해서는 표준화를 통해 통합해야 합니다.
시계열성(Time variant)
데이터 웨어하우스는 시계열적입니다. 즉, 기록 데이터를 저장하고 시간 경과에 따른 변경 사항을 저장하고 있습니다. 이러한 과거 관점은 추세 분석, 다양한 기간의 성과 비교, 정보에 입각한 비즈니스 결정을 내리는 데 유용합니다. DW에서는 과거 10년 이상의 오래된 데이터에 대해서도 보관합니다. 물론 고객 정보의 경우 비식별처리 후 진행됩니다. 업무 시스템에서는 현재 데이터에 대한 정확성이 요구되지만, DW에서는 현재 및 과거시점에 정확성 모두 요구됩니다.
휘발성(Non-volatile)
데이터 웨어하우스의 데이터는 비휘발성입니다. 즉, 데이터가 웨어하우스에 데이터가 로드되면 일반적으로 자주 업데이트되거나 삭제되지 않습니다. 대신 기존 데이터에 새 데이터가 추가(insert)됩니다. 이를 통해 보고 목적의 데이터 일관성과 안정성이 보장됩니다.
중앙 집중식 및 요약
데이터 웨어하우스는 중앙 집중적이고 일관된 데이터 보기를 제공합니다. 이는 조직의 단일 정보 소스 역할을 하여 데이터 불일치를 줄이고 전체의 사용자가 동일한 정보에 액세스할 수 있도록 보장합니다. 업무 시스템은 트랜잭션 데이터가 중심이라면 DW는 요약 및 상세 데이터를 주로 생성합니다.
대규모 저장 및 처리
데이터 웨어하우스는 대용량 데이터를 처리하기 위해 구축되었습니다. 병렬 처리 및 분산 아키텍처를 활용하여 수평적으로 확장하고 증가하는 데이터 요구 사항을 수용합니다. 이러한 확장성을 통해 웨어하우스는 증가하는 데이터 저장 및 분석 수요를 처리할 수 있습니다. 대규모 데이터 효율적인 분석을 촉진하기 위해 인덱싱, 파티셔닝, 사전 집계와 같은 최적화 기술을 통합하는 경우가 많습니다.
마무리
데이터 웨어하우스는 주제 지향적, 통합적, 시계열성, 휘발성, 중앙 집중식 및 요약, 대규모 저장 및 처리 등의 특징을 가지고 있습니다. 이러한 6가지 특성을 종합하면 데이터 웨어하우스는 전략적 의사 결정 및 비즈니스를 위해 데이터의 활용하기 위한 시스템임을 알 수 있습니다.
'데이터베이스' 카테고리의 다른 글
데이터 마트(Data Mart) 설계 - 다차원 모델링, OLAP (2) | 2023.12.15 |
---|---|
데이터 마트(Data Mart) 특징 및 ETL (0) | 2023.12.14 |
데이터웨어하우스(DW) 어떻게 처리 할까? - STG, ODS, DW, Mart (0) | 2023.12.12 |
데이터웨어하우스(DW)는 왜 필요했나? (0) | 2023.12.11 |
순환관계의 전개 - SYS_CONNECT_BY_PATH (1) | 2023.12.08 |