[머신러닝] Decision Tree 1

Decision Tree(이론)

Decision Tree(결정 트리)는 분류와 회귀 모두 가능한 ML 모델 중 하나이다.

Decision Tree란?

데이터를 분석해서 이들 데이터 사이에 존재하는 패턴을 찾고 예측 가능한 규칙들의 조합을 만드는 알고리즘이다. 주로 변수들이 이산적인 데이터일때 classification 작업을 위해 많이 사용된다.

Classification Algorithms - Decision Tree - Tutorialspoint

image-20201021212722620

결과적으로 0.9544 →0.7489 로 Entropy 가 분기 후 감소했다. 즉, 불확실성 감소, 순도 증가, 0.9544-0.7489 만큼의 정보 획득량이 발생했다.

이 분기가 최적 인지는 알지 못하지만

Decision Tree는 정보획득량이 최대로 증가하도록 분기를 증가한다!!!!!!!!!!!!!!!!!!!!!!!!!!!!!