의사결정나무 구현단계
1. 데이터 삽입
2. 학습(train, 모형 설정을 위한 데이터) / 실험(test, 모형의 정확성을 확인하는 데이터) 데이터 설정
3. 의사결정나무 모형 설정
4. 분류실시
5. 성과분석
6. 모형수정
과대적합 over fitting
training set 이 정확한 결과를 보여주기 위해서 복잡하게 모델을 만드는 것. training data 에서는 정확도가 높지만 새로운 데이터가 입력되면 잘못 예측할 수 있다.
과소적합 under fitting
모델이 너무 간단해서 정확도가 낮은 모델. training data 조차도 정확도가 떨어진다.
과대적합과 과소적합의 문제점을 해결하기 위해서는 더 많고 다양한 데이터를 확보하고 확보한 데이터로부터 다양한 특징을 찾아내야 한다.
'ADsP' 카테고리의 다른 글
ADsP 분류분석 성능평가 (0) | 2021.05.11 |
---|---|
ADsP 로지스틱 회귀분석 (0) | 2021.05.10 |
ADsP 기술통계 (0) | 2021.05.08 |
ADsP 분류분석 (0) | 2021.05.07 |
ADsP 데이터 마이닝 개요 (0) | 2021.05.06 |