ADsP

ADsP 기술통계

Gimpapa 2021. 5. 8. 08:20

 

기술통계

자료를 요약하는 기초적 통계

데이터 분석에 앞어 데이터의 대략적인 통계적 수치를 계산해 봄으로써 데이터에 대한 대략적 이해와 분석에 대한 통찰력을 얻기에 유리

데이터 마이닝에 앞서 데이터의 기술통계를 확인해보는 것이 좋음

 

범주형 자료

도수분포표 : 명목척도, 순서척도. 조사된 데이터를 도수(빈도)로 나타낸 표

바 차트 : 도수분포를 그래프로 표현

상대도수 분포표 : 도수를 총 도수로 나눈 비율의 분포표

파이차트 : 데이터 비율을 원의 각도로 변환, 원으로 표현한 방법

 

정량적 자료

히스토그램 : 연속된 데이터를 구간으로 나누어 도수를 계산하여 막대그림으로 그림

줄기-잎 그림 : 연속된 자료를 왼쪽을 줄기, 오른쪽을 잎으로 나타내며 데이터를 표현

상자그림 box plot : 5개 숫자요약에 기초한 분포의 개략적 그림

 

박스플롯의 요소

박스플롯 하한 : 1사분위수 - 1.5 x IQR

박스 하단 : 1사분위수

박스 중앙 : 2사분위수

박스 상단 : 3사분위수

박스플롯 상한 : 3사분위수 + 1.5 x IQR

 

상관분석 correlation analysis

데이터 안의 두 변수간의 관계를 알아보기 위한 분석

두 변순의 상관관계를 알기위해 상관계수 correlation coefficient 이용

1 혹은 -1 에 가까울수록 강한 양 혹은 음의 상관관계를 나타내고 상관관계가 없으면 0

양의 상관관계 : 같은 방향

음의 상관관계 : 서로 반대방향

0의 상관관계 : 상호 독립적인 방향

 

상관관계 유형

피어슨 상관계수 : 등간 척도 이상으로 측정되는 두 변수의 상관관계 측정(연속형 변수)

스피어만 상관계수 : 서열 척도인 두 변수의 상관관계 측정 (순서형 변수)

 

 

'ADsP' 카테고리의 다른 글

ADsP 로지스틱 회귀분석  (0) 2021.05.10
ADsP 의사결정나무  (0) 2021.05.09
ADsP 분류분석  (0) 2021.05.07
ADsP 데이터 마이닝 개요  (0) 2021.05.06
ADsP 시계열분석과 차원축소  (0) 2021.05.05