기계 학습 : 젠 토토 결정 트리 최종

2019 년 1 월 29 일

 

Dr. Jason M. Pittman, D.Sc.

의사 결정 트리 개념

기계 학습 세계로의 지속적인 여행에 다시 오신 것을 환영합니다. 이 시리즈의 우리의 목표는 주제를 탈취하고 인간이 기계를 가르 칠뿐만 아니라 기계가 스스로 가르치는 것을 가능하게하는 과정을 세분화하는 것입니다..

in이전 블로그 게시물, 우리는 젠 토토 결정 트리에 대한 토론에서 용어와 개념을 조금 더 깊이 탐구하기 위해 작은 측면 단계를 밟았습니다. 때때로 우리는 그렇게해야합니다. 그러나 이제는 실습 작업으로 돌아갈 시간입니다. 젠 토토 결정 트리에 대한 이해를 마무리하면서 시작합시다.

간단한 요약

이 시점까지, 우리는 학생이 프로그래밍 과정을 좋아하는지 여부를 예측할 수있는 이진 분류 알고리즘을 검사했습니다. 알고리즘은 감독되므로 우리가 가지고 있음을 의미합니다.데이터예측 방법에 대한 알고리즘의 교육 세트로 사용하려면

우리가 개발 한 특정 용도는 프로그래밍 과정을위한 분류기입니다. 즉, 학생들은 프로그래밍에 대한 사전 경험과 코스 일정에 대한 사전 경험 (예 : 시간)을 기반으로 프로그래밍 수업을 좋아할 것입니까?

코스 분류기

우리는 이미 교육 데이터 세트를 설명했습니다. 우리는 젠 토토 결정 트리를 가로 질러 비밀 소스를 남겼습니다. 나는 언급하고있다분할.내부 노드에 도달했을 때 취한 조치 또는기능. 우리가 분할되면 기본적으로 데이터를 정렬하고and아니요젠 토토 결정 트리 잎으로 대표되는 서브 세트 또는엔드 노드. 보다 정확하게, 우리는 우리의 질문에 표시되는 이진 분류 범주를 나타내는 서브 세트로 나누고 있습니다 (암시 적 예 또는 아니오 관련주어진 학생은 특정 프로그래밍 클래스처럼?).

일반적인 젠 토토 코드 예를 살펴 보겠습니다.

기능 훈련이 트리를 반환
    privation_experience = '예'이고 코스 = '프로그래밍'인 경우 label = 'yes'

    시간 = '밤'이면 label = 'no'
   
    privation_experience = 'no'및 course = '프로그래밍'인 경우 label = 'no'

이러한 함수는 분명히 완전하지 않으며 함수는 훈련만을 나타냅니다. 그러나 나는 이것이 관련된 간단한 논리를 보여준다고 생각합니다. 우리는 프로그래머로서 우리가 알고리즘이 결정을 내리는 방법 (즉, 분할 및 분류)과 관련된 지침이나 규칙을 정의하고 있다는 것입니다. 이것이 그러한 프로그램의 추정 지능을 비난하지만, 젠 토토 결정 트리를 사용하여 부여 된 기술력을 줄인 적이 없다고 생각합니다.  학생이 의지 여부 예측좋아요클래스는 관련된 모든 사람에게 매우 유익 할 것입니다. 동의합니까?

앞으로 나아가

내 친구는 기본적인 감독 바이너리 분류 결정 트리입니다. 확실히, 우리가 여기에서 본 것보다 프로그래밍 구현에는 더 많은 것이 있습니다. 그러나 우리는 간단한 범주 적 예측을 할 때 기계가 지능적으로 보일 수있는 방법을 둘러싼 일부 미스터리를 적절하게 파괴 할만 큼 충분히 보았다고 생각합니다. 다행히 머신 러닝을 통해 더 많은 부분이 있습니다. 다음 번에 알고리즘이 젠 토토 결정 비용 및 정보 이득과 같은 것들을 계산하는 방법에 대한 세부 정보를 노출시킬 때 저와 함께하십시오.