기계 학습 - 편견 및 보스 토토 에지

2019 년 3 월 19 일

작성자 : Jason M. Pittman, SCD

Jason Pittman

보스 토토는 왼쪽마지막 시간의사 결정 트리 결정을위한 ID3 알고리즘 및 방정식 검사루트. 따라서 이제 보스 토토는 의사 결정 트리에 대한 적절한 실무 지식과 기계 학습이 알고리즘에 유용한 문제의 유형에 대한 아이디어를 가지고 있습니다. 머신 러닝은 보스 토토가 지금까지 보았던 것 이상입니다. 따라서, 탈시기 기계 학습 연속체에서 보스 토토의 입장을 바탕으로, 나는 편견에 대해 논의하는 것이 유익 할 수 있다고 생각했다.Extreme Edges.

바이어스는 크게 눈에 띄지 않는 경향이 있기 때문에 나에게 흥미 롭습니다. 보스 토토적 인 가장자리는 기술적으로 오류이지만 신비하게 유효한 결과 인 것으로 보이기 때문에 호기심 많은 현상입니다.주류 미디어이러한 유형의 문제에 매우주의를 기울여 왔으며정치인악 ​​대차에 뛰어 들었습니다.

바이어스 및 보스 토토 에지

보스 토토가 물어봐야 할 운영상의 중요한 질문은입니다.바이어스 또는 보스 토토적 인 가장자리로 이어지는 것은? 먼저 두 조건을 올바르게 구별하기 위해주의해야합니다. 정의 측면에서, 바이어스는 우리의 가정에서 부정확하지만 보스 토토적 인 가장자리는 특징이거나 라벨과 비슷합니다.

명백한 대답이 모든 것이 배울 수있는 것은 아니라고 생각합니다. 예, 맞습니다 - 머신 러닝이 모든 문제에 적용되는 것은 아닙니다. 보스 토토는 이것에 대해 느슨하게 이야기했습니다응답그래서 나는 그것을 떠날 것입니다. 당분간, 나는 학습 가능한 상황에 집중하고 싶다.

학습 가능한 상황에서, 분명한 대답은 보스 토토가 교육 데이터 세트를 조립하기 전에 대답이 무엇인지에 대한 보스 토토의 감각을 가지고 결정을 선택하면 처리 된 정보의 편견을 직접 이끌어냅니다. 여기서는 문제를 명확히하는 데이터를 간과하거나 배제 할 수 있습니다. 여기서 이해해야 할 중요한 요소는 알고리즘 자체가 종종 편견의 원인이 아니라는 것입니다. 아니요, 알고리즘은 편향을 도입하지 않지만 그러한 것을 증폭시킬 것입니다.

Danger Cliff Edge 표시

아마도 덜 명백한 대답은 보스 토토의 의사 결정 트리가 너무 얕거나 너무 깊을 수 있다는 것입니다. 전자의 경우, 보스 토토는 나중에 더 최적의 결정을 찾지 않고도 초기 결정에 부주의하게 잠길 수 있습니다. 한편, 보스 토토의 나무가 너무 깊다면, 보스 토토는 바람직하게 보이지만 실제로는 일반 인구의 대표가없는 성능을위한 계산 경계 또는 과도한 선택 특징을 얻을 수 있습니다..

마지막으로 데이터의 노이즈에 대해 생각할 수 있습니다. 노이즈는 데이터의 오류, 불완전한 데이터 또는 소스 데이터를 포함하는 기판의 문제로 나타날 수 있습니다. 효과는 미묘하거나 심오 할 수 있지만 종종 본질적으로 단순합니다. 오타, 5를 의도했을 때 1의 값을 할당하거나 비뚤어진 데이터를 생성하는 잘못 정렬 된 센서에 대해 생각해보십시오. 이러한 것들 중 어느 것도 훈련 데이터 나 샘플에있을 수 있습니다.

그것에 대해해야 할 일

더 많은 유형의 바이어스와 극한 가장자리가 있습니다. 그러나 보스 토토는 탄탄한 후속 질문을 일시 중지하고 제기 할 수 있습니다. 이러한 문제를 예방하기 위해 무엇을 할 수 있습니까? 먼저, 보스 토토는 항상 훈련 데이터가 깨끗한지 확인해야합니다. 즉, 소스를 점검하고 다시 확인하는 것을 의미합니다. 둘째, 보스 토토는 어떤 상황에서도 실제로 훈련 데이터를 보지 않아야합니다. 글쎄, 보스 토토는 어떻게 알고리즘을 설계합니까? 다음에 탐색하는 좋은 질문입니다!