작성 중..

DW에서는 여러가지 이유로 데이터가 중복된다.

필자가 아는 DW의 모델링 기법은 3정규화된 모델, 다차원 모델, 데이터 볼트 이렇게 3개다. 데이터 볼트는 3정규화와 다차원의 하이브리드 방식의 모델링 기법이다. 3가지 모델링 기법이 모두 장/단점이 있으니 뭐가 좋다고는 할 수 없다. 상황에 맞출뿐이다. 마지막의 '중복되는지도 모르는 중복 or 중복의 커다란 영향력을 인식하지 못함'이 문제이지 다른 것은 문제라고 볼 수는 없다. 기술적인 한계라고나 할까?

문제는 우리나라에선 DW라고 하면 꼭 다차원 모델링을 해야하는 것으로 오인되고 있다는 것이다. 이상적인 DW 데이터 모델링 방법은 3정규화된 모델이다.