1. 데이터 추출
데이터는 아래와 같은 방법으로 가져와서 분석에 이용한다.
- DW date warehouse (전사) 와 DM data mart (개별부서) 에서 데이터를 가져온다.
- 기존운영시스템 legacy 에서 가져오거나 ODS operation data store 에서 전처리(정제)된 데이터를 가져와 DW 에서 가져온 내용과 결합하여 활용한다.
- 스테이징 영역 staging (현장, 실무) 에서 가져온 데이터는 정제되어 있지 않기 때문에 데이터 전처리를 통해 DW 또는 DM 과 결합해 사용한다.
2. 시각화 그래프
- 가장 낮은 수준의 분석이지만 빅데이터 분석에서는 필수적이다.
- 탐색적 분석을 할 때 시각화는 필수이다.
3. 공간분석
공간적 차원과 관련된 속성을 시각화 하는 분석이다.
4. 탐색적 자료분석 EDA exploratory data analysis
데이터가의 특성과 구조적인 관계를 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 방법이다.
5. 통계분석
- 기술 descriptive 통계 : 모집단에서 표본을 추출한다. 표본이 가지고 있는 정보를 파악하기 위해 데이터를 정리하고 요약하는 절차이다. 표본의 정보를 요약하여 표현한다.
- 추측 inferential 통계 : 모집단에서 추출된 표본의 표본통계량으로부터 모집단 특성인 모수에 관해 통계적으로 추론하는 절차를 말한다. 표본으로 모집단을 추론한다.
'ADsP' 카테고리의 다른 글
ADsP 통계분석 추정과 가설검정 (0) | 2021.05.01 |
---|---|
ADsP 확률과 통계 (0) | 2021.05.01 |
ADsP R 데이터 구조 및 외부 파일 읽기 (0) | 2021.03.12 |
ADsP R프로그램 소개 및 설치 (0) | 2021.03.12 |
ADsP 322 분석 거버넌스 체계 (0) | 2021.03.11 |