기계 학습 : 의사 결정 토토
2019 년 2 월 13 일Jason M. Pittman, DSC
머신 러닝의 다른 인스턴스로 다시 오신 것을 환영토토다.
최근에, 우리는 토토 결정 트리와 관련된 가장 중요한 논리를 마무리했습니다. 토토 결정 트리는 많은 기계 학습 알고리즘 중 하나 일 뿐이며 각 유형의 특정 유형의 문제에 매핑됩니다. 따라서, 우리는 토토 결정 트리가 분류 및 회귀 양식 모두에서 어떤 것이 무엇인지, 단순한 분류기가 토토 코드에서 어떻게 보이는지 표현할 수 있어야합니다..
당신은 또한 토토 결정 트리의 본질, 비밀 소스가에 존재한다는 것을 기억할 것입니다토토옵션 토토. 분할은 정확히 어떻게 계산됩니까? 알아 보자!
분할 토토 개요
언뜻보기에, 분할 토토 계산은 우리가 지금까지 다룬 지상에 비해 의사 결정 트리의 더 어려운 측면처럼 보입니다. 먼저 약간의 선명도를 구축하겠습니다. 알고리즘이 문제와 쌍을 이루는 것처럼 토토 계산은 알고리즘 유형과 쌍을 이룹니다. 즉, 다른 토토 함수에는 몇 가지 일반적인 속성이 있습니다.
예를 들어, 모든 토토 함수는를 찾으려고합니다.최저주어진 분할과 관련된 토토. 우리의 알고리즘은 Descision 트리의 모든 분할 토토을 계산하는 경향이 있습니다.토토최저 토토 노드 사이의 연결을 매핑하여. 항상 그렇듯이 몇 가지 중요한 차이점이 있습니다.
분류 및부터 시작합시다Gini Functions. GINI 기능은 기계 학습에서 일반적인 분할 토토 계산입니다. 복수를 주목하십니까? 맞습니다. 이진 결정과 관련된 한 가지 형태가 이분법적인 결정을 처리하기 때문에 이진 결정과 관련된 한 가지 형태가 있습니다 (예 : 예 또는 지금, 진실 또는 거짓 등이 있습니다. 따라서 그러한 결정의 교차점에서 분할이 발생합니다. 물론 비 이진 결정과 관련된 또 다른 형태가 있습니다..
첫 번째, 이진 분류 양식은지니 계수. 이름 만 관련하여, 이진이 아닌 형식은입니다.지니 불순물및 다중 클래스 상황을 처리토토다. 이 양식이 동등하지 않거나 상호 교환 가능하지 않다는 것을 아는 것이 중요토토다.
그건 그렇고, Gini는 좋아한다고 발음토토다genie.
분할 토토 그림
앞에서 언급했듯이 분할 토토 계산은 기계 학습 작업의 더 어려운 부분처럼 보일 수 있습니다. 나는 그것이 관련되어 있음에도 불구하고 왜 그것이 실제로 사실이 아닌지를 설명 할 것입니다 ... 예, 맞습니다 - 수학. 약간 수정 된 학생 코스 선호도 테이블을 사용하여 데이터를 설명합시다.
광범위하게 정의 된, 분류기에 사용되는 Gini 함수의 방정식은 다음과 같은 것 같토토다.
gini = 1- ∑ (클래스의 개체/Total-Objects)2
예시하기 위해, 토토는 2 개의 속성 (이전 경험, 시간)과 총 10 개의 샘플을 가진 2 개의 클래스 (좋아)가 있습니다. 의 5 가지 인스턴스가 있습니다.예샘플의 클래스와 5아니오클래스. 따라서 토토는 이것을 다음과 인코딩 할 수 있습니다.
1- [(2 / 10)] 2+ [(2 / 10)]2=?
결과가 여기에 있다고 생각하십니까? 값은 무엇을 나타 냅니까? 우리는 대체 토토 기능뿐만 아니라 다음에 답을 더 깊이 살펴볼 것입니다.