더보기 if ~ else 를 자동으로 찾아내 예측을 위한 규칙생성 최상위 노드 - root 노드 값이 결정되는 노드 - 리프노드 Depth 깊이 - 아래 그림은 3 뎁스 뎁스가 길수록 세분한 분류가 가능하지만 길어지다 보면 과적합이 발생한다 지니 불순도 정보이득 엔트로피 개념을 기반 엔트로피 - 무질서한 정도 서로 다른 값이 섞여 있으면 엔트로피가 높음 서로 같은 값이 섞여 있으면 엔트로피가 낮음 정보이득 지수 = 1 - 엔트로피 지수 정보이득 지수는 높을수록 좋다 지니계수 지니계수는 낮을수록 좋다 지니계수가 낮을 수록 균일도가 높음 통계적 분산 정도를 정량화해서 표현한 값, 0과 1사이의 값을 가짐 지니계수가 높을 수록 잘 분류되지 못한 것 import pandas as pd import numpy a..