BW

SAP OLAP, DW 정의와 장점

허니시대 2021. 12. 19. 15:26
반응형

OLAP의 이해

- OLTP(On-Line Transaction Processing)의 반대되는 개념으로, 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정이다.   

1) 다차원 정보

2) 직접 접근- 데이터를 사용자가 원하는 형태의 보고서로 중간의 어떠한 과정 없이 직접 가져감   

3) 대화식 분석
- 정형화된 보고서가 아닌 사용자와 시스템 사이의 상호작용(Interaction)을 통해 정보를 분석하며 원하는 결과를 얻을 때까지 계속해서 분석을 수행한다.   

4) 의사결정에 활용
- OLTP :  원시 데이터가 실제로 발생하고 기록되는 시스템으로 '무엇(What)'에 초점을 맞추고, 현재의 거래 상태를 정확하고 기록하고 갱신할 수 있도록 하는 것        
- OLAP : 수집된 데이터를 의사결정에 활용하는 측면을 담당하며, '왜(Why)'에 초점이 맞추어진다.        
- OLTP시스템이 일상적인 기업의 운영을 지원하는 반면, OLAP 시스템은 기업의 방향을 설정하는 역할을 한다.


DW와 OLAP

1.  데이타웨어 하우징  

1) 사상 : 기존의 의사결정 지원 시스템의 한계를 극복하기 위해, 전사적인 아키텍처 상에서 의사결정을 지원하기 위한 환경을 구축하는 것   

2) 정의 : 사용자의 의사결정을 지원하기 위해 기업이 축적한 많은 데이터(Time Variant)를 사용자 관점에서 주제별(Subject - Oriented)로 통합(Integrated)하여 별도의 장소에 저장 해 놓은 데이터 베이스이다. 

3) 장점        
- 운영시스템을 보호하고 사용자 질의에 신속한 응답 성능을 제공       
- 필요한 데이터로의 접근이 용이하다.       
- 정제 및 검증과정을 거친 데이터이므로 사용자는 양질의 데이터 사용이 가능하다.   

4) 목적 : 데이터에 기반한 의사결정의 효과성을 향상시키는 것으로, 기업의 주요 의사결정을 막연한 감이나 불완전한 데이터에 의존하는 대신 통합된 데이터를 바탕으로 사실에 근거하여 이루어지도록 한다.   

5) 데이터 웨어하우스 아키텍처

 

2. 데이터의 추출 및 가공   

1) 데이터 로딩       
- 운영시스템의 데이터는 단순히 추출(Extraction)되어 웨어하우스로 복제(Replication)되는 것이 아니라 전사적 모델에 기초하여 통합된다.       
- 이 단계에서 정제(Cleansing) 및 변형(Transformation) 과정을 필요로 한다. 즉 중복된 데이터는 제거되고 잘못된 값은 수정되며 다양한 포맷의 데이터가 하나의 포맷으로 통일된다. 필요한 경우 데이터는 집계되고 연산과정을 거쳐 변형된다.   

2) 추출 도구      
- 제1세대 : 코드 생성기(Code Generator) 역할을 수행했는데, 개발자가 소스 데이터와 타겟 데이터 사이의 대응관계와 변환 규칙을 정의해 주면 자동으로 코볼이나 C 프로그램 소스를 생성함       
- 제2세대 : 코드 생성 방식에서 변환 엔진 방식으로 변경되었다. 즉 추출 도구가 추출의 전 과정을 제어하는 방식인데, 관계형 소스나 플랫 파일에서 데이터를 직접 추출하여 변환 엔진에서 변경 작업을 거친 다음 타겟 데이터베이스에 직접 데이터를 로딩한다.   

3) 메타데이터(Metadata)       
- 추출 및 변형과정에서 소스와 타겟 사이의 대응관계 설정(Mapping), 변환 규칙, 추출 주기 등같이 부가적으로 발생하는 데이터를 말한다.       
- 2세대 추출 툴에서는 메타데이터 리파지토리(Repository)를 통해 중앙집중식으로 관리한다.   

4) 데이터마트       
- 개발자가 웨어하우스 설계 및 소스 데이터 분석, 맵핑 및 가공 작업 등을 통합된 GUI 환경에서수행하고, 작업 과정에서 발생하는 메타데이터를 리파지토리를 통해 통합적으로 저장하고 관리한다.        

 

3. 데이터웨어하우스와 데이터마트   

1) 데이터웨어하우스의 특징       
- 웨어하우스는 최종 사용자와의 인터페이스보다는 방대한 분량의 데이터를 효율적으로 통합하고 관리하는 측면에 보다 초점을 맞춘다.       
- 전사적인 도구로 구축되기 때문에 각 개별 부서나 사용자 집단에 적합한 형태로 데이터가 저장되지 않는다. 따라서 사용자 질의에 대한 최적의 성능을 제공하지 못할 수 있다.       
- 저장된 데이터의 일부만을 사용하므로 전체 시스템에 심각한 부하가 걸릴 수 있다.   

2) 데이터마트       
- 이해관계가 동일한 사용자 집단에 특화된 사용자 중심의 데이터 저장고이다.      
- 동질적인 사용자 집단에게 유사한 비즈니스 모델과 비즈니스 언어를 제공함으로써 데이터에 대한 가독성(Legibility)을 높이는데 초점을 맞춘다.       
- 웨어하우스의 일차적 초점이 인프라의 구축이라면, 데이터마트는 사용자와의 인터페이스이다.       
- 웨어하우스가 데이터의 통합과 관리에 비중을 둔 반면, 데이터마트는 사용자 액세스와 가독성에 보다 초점을 맞추었다.

 

4. 데이터웨어하우징과 OLAP 시스템

1) 비교

 

2) 데이터웨어하우징의 변화
- 초기에는  '어떻게 구축할 것인가'에 맞추어졌으나, 점차적으로 '어떻게 활용할 것인가'로 발전하였다.

 

5. 메타데이터의 관리  

1) 메타데이터 :데이터웨어하우스의 구축에서 활용까지의 전반적인 과정을 통해 발생되는 데이터로 데이터를 올바르게 사용하고 관리할 수 있도록 하위 레벨 데이터를 기술하는 상위 레벨 데이터   

2) 관리자용 메타데이터       
- 데이터 소스 시스템으로부터 추출될 데이터와 추출된 데이터의 변환 규칙, 웨어하우스 데이터와의 대응관계(Mapping), 추출 주기 등을 포함하여 복잡한 웨어하우스 환경을 지속적으로 유지하고 관리하기 위해 사용되는 모든 메타데이터이다.

3) 사용자 메타데이터        
- 사용자가 웨어하우스를 올바르게 사용하기 위해 필요한 메타데이터로 저장된 데이터를 쉽게 이해할 수 있도록 하는데 목적이 있다.     

4) 메타데이터의 Coalition       
- 메타데이터의 표준을 만들기 위해 만들어진 단체로, 다양한 툴 간에 메타데이터를 주고받을 수 있는 표준 교환 양식인 MDIS(Meta Data Interchange Specification)을 만들었다.

728x90
반응형

'BW' 카테고리의 다른 글

스타스키마, 차원과 큐브의 이해  (0) 2021.12.19
다차원 모델의 구성요소  (0) 2021.12.19