ADsP

ADsP 의사결정나무

김파파 2021. 5. 9. 08:20

 

의사결정나무 구현단계

1. 데이터 삽입

2. 학습(train, 모형 설정을 위한 데이터) / 실험(test, 모형의 정확성을 확인하는 데이터) 데이터 설정

3. 의사결정나무 모형 설정

4. 분류실시

5. 성과분석

6. 모형수정

 

과대적합 over fitting

training set 이 정확한 결과를 보여주기 위해서 복잡하게 모델을 만드는 것. training data 에서는 정확도가 높지만 새로운 데이터가 입력되면 잘못 예측할 수 있다.

 

과소적합 under fitting

모델이 너무 간단해서 정확도가 낮은 모델. training data 조차도 정확도가 떨어진다.

 

과대적합과 과소적합의 문제점을 해결하기 위해서는 더 많고 다양한 데이터를 확보하고 확보한 데이터로부터 다양한 특징을 찾아내야 한다.

 

 

'ADsP' 카테고리의 다른 글

ADsP 분류분석 성능평가  (0) 2021.05.11
ADsP 로지스틱 회귀분석  (0) 2021.05.10
ADsP 기술통계  (0) 2021.05.08
ADsP 분류분석  (0) 2021.05.07
ADsP 데이터 마이닝 개요  (0) 2021.05.06