이번 포스팅에서는 데이터 표준화에 대해 알아보도록 하겠습니다. 데이터베이스 영역의 스터디이기 때문에 데이터 분석에서 데이터 표준화(standardization)와는 다른 내용입니다. 데이터의 구조인 테이블, 컬럼 등의 표준화를 말합니다.
데이터 표준화는 개발 초기부터 업무를 파악하고 진행하게 됩니다. 보통 데이터 업계에서는 표준화를 신입 직원들에게 맡깁니다. 2~3일의 교육만으로 개념을 잡고 시작할 수 있기 때문이죠. 부족한 부분은 시니어 모델러들이 알려주는 방식으로 진행합니다.
사실 제대로 한다면 경험있는 표준화 담당자가 고객과 인터뷰를 통해 전사의 단어와 용어를 제대로 정의해야 합니다. 하지만 리소스와 기간의 한계 때문에 어쩔수 없는 상황입니다.
표준화되지 않았을 때 문제점
만약 관리하는 시스템이 데이터 표준화가 되어 있지 않다면 여러 가지 문제점이 있습니다. 요약해 보면 아래와 같습니다.
1. 협업 및 의사소통 어려움
기업 내부 여러 시스템에서 동일한 의미의 데이터를 다른 명칭으로 정의하여 사용한다면 어떻게 될까요? 다른 의미의 데이터인데 동일한 명칭을 사용하는 경우도 발생할 것입니다. 이렇게 되면 시스템 및 팀 간의 서로 의사소통이나 데이터 공유 할 때 문제점 발생하게 됩니다. 다른 데이터를 주고받을 수 있습니다.
2. 데이터 분석의 어려움
시스템이나 업무 개발 시 현행 시스템의 데이터 분석을 하는데 많은 시간이 소요됩니다. 왜냐하면 정확한 정보를 파악하기 어렵기 때문입니다.
3. 데이터 활용의 어려움
기존 데이터의 활용이 불가능할 경우가 발생하고 또 다시 중복데이터가 발생할 수 있습니다.
4. 데이터 통합의 어려움
여러 조직의 원천 데이터를 통합 하는 시스템(Data Warehouse) 개발할 때 문제가 됩니다. 중복데이터 항목과 용어의 의미 파악이 어렵기 때문입니다.
데이터 문제점 발생의 원인
그렇다면 문제점이 발생하는 원인은 무엇일까요? 이유는 해당 기업에 표준화 가이드가 없거나, 표준화를 하더라도 단위 시스템 별로 표준화를 개별적으로 하기 때문입니다. 일반적으로 시스템 개발의 동시에 발생하게 되면 타 시스템의 데이터를 분석할 시간이 없습니다.
이럴 경우 표준화 정책은 존재하는 통합 관리 시스템이 없어 용어의 표준적용여부나 이미 존재하는 용어의 파악이 어렵게 됩니다. 이렇게 기업의 전사적으로 표준가이드와 관리 시스템이 없는 경우 시스템별로 표준이 진행되어 난관에 봉착하는 경우가 생깁니다.
이런 문제점을 방지하기 위한 데이터 관리 방안이 있습니다. 바로 데이터 표준화 가이드를 마련하는 것입니다. 기업의 마케팅 전략 및 의사결정에 영향을 미치는 핵심 요소가 데이터입니다. ‘데이터’의 통합 관리 및 품질 향상을 위해 데이터표준화 활동은 반드시 필요합니다.
데이터 표준화 활동 시 기대 효과
- 동일한 데이터는 동일한 명칭과 데이터속성을 가지므로 다양한 사용자간의 의사소통을 원활하게 할 수 있습니다.
- 필요한 데이터가 어디에 있는지 파악하기 쉬워 시간을 절약할 수 있습니다.
- 동일한 데이터에 대해 동일한 표준 규칙을 적용함으로써 데이터 품질 향상시킬 수 있습니다.
- 시스템 간의 데이터 인터페이스 시 상대 시스템의 데이터유형을 파악하여 변환 또는 클린징해야 할 필요가 없습니다.
- 데이터 분석하고 파악하는 데 소요되는 비용을 줄일 수 있습니다.
마무리
요약하면, 데이터베이스에서 테이블명과 컬럼명을 표준화하는 것은 데이터의 관리, 데이터의 이해, 일관성, 보안, 코드 유지 관리 및 데이터 모델링에 도움이 됩니다. 생각해 보면 SQL 쿼리 작성이 간편해진다는 것을 알 수 있습니다. 쿼리를 작성할 때 테이블과 컬럼을 정확하게 알 수 있고, 오타나 오류를 줄일 수 있습니다. 이렇게 전사적으로 데이터 표준화 가이드를 마련하는 것은 전체 시스템의 효율성을 향상시킵니다.
'데이터베이스' 카테고리의 다른 글
데이터베이스(Database) 종류, DB 역사는 어떻게 달라졌나? (1) | 2023.11.06 |
---|---|
데이터베이스 아키텍처 구성 요소 및 작동 원리 (0) | 2023.11.03 |
데이터베이스(Database)는 어떤 특징이 있는가? (0) | 2023.11.02 |
데이터 표준화 - 표준 코드, 코드 유형, 코드 에러 사례 (0) | 2023.10.31 |
데이터 표준화 - 표준단어, 도메인, 표준용어 (0) | 2023.10.30 |