ADsP 의사결정나무

ADsP

Gimpapa 2021. 5. 9. 08:20

의사결정나무 구현단계

1. 데이터 삽입

2. 학습(train, 모형 설정을 위한 데이터) / 실험(test, 모형의 정확성을 확인하는 데이터) 데이터 설정

3. 의사결정나무 모형 설정

4. 분류실시

5. 성과분석

6. 모형수정

과대적합 over fitting

training set 이 정확한 결과를 보여주기 위해서 복잡하게 모델을 만드는 것. training data 에서는 정확도가 높지만 새로운 데이터가 입력되면 잘못 예측할 수 있다.

과소적합 under fitting

모델이 너무 간단해서 정확도가 낮은 모델. training data 조차도 정확도가 떨어진다.

과대적합과 과소적합의 문제점을 해결하기 위해서는 더 많고 다양한 데이터를 확보하고 확보한 데이터로부터 다양한 특징을 찾아내야 한다.

김파파의 일상