기계 학습 - 적대적 토토 커뮤니티리즘

2019 년 4 월 2 일

우리는 간단히 논의했습니다바이어스 및 극단 에지기계 학습이 왜곡 된 정보를 생성 할 수있는 방법으로. 두 경우 모두 효과적인 만트라는쓰레기, 쓰레기 아웃. 다시 말해, 나쁜 데이터는 거의 항상 나쁜 정보로 이어질 것입니다. 따라서 우리는 지난번에 예방 문제로 떠났다. 보다 구체적으로, 우리는 교육 데이터를 신뢰하거나 교육 데이터 세트를 연구하지 않아야한다면 효과적인 토토 커뮤니티리즘을 설계 할 수있는 방법이 궁금했습니다. 테스트 데이터를 반드시 신뢰해서는 안된다는 점을 이제 추가하겠습니다. 따라서 우리는 최악의 상황을 가정하고 그에 따라 토토 커뮤니티리즘을 구성해야합니다. 확인하십시오.

최악의 가정

내가 당신에게 말하려고하는 것이 어떻게 비관적 인 것처럼 보일지 이해합니다. 내 입장이 단순히 실용적이라고 확신합니다. 간단히 말해, 여기에는 적들이 있습니다. 모든 상황에서 항상 데이터, 운영 환경 및 구현에서 최악의 상황을 가정합니다. 즉, 우리는 토토 커뮤니티리즘을 강력하고 탄력적으로 설계 할 수 있습니다. 예, 적대적인 조건에서 배울 수 있기를 바랍니다.

이진 배경 앞의 소녀

우리의 목적을 위해, 나는 데이터를 통한 대적 상호 작용에 집중하고 싶습니다. 나는 이것을 추가 토토 커뮤니티리즘의 사용과 차별화하여 악의적으로 수행하거나 건설적으로 수행 할 수있는 적대적 요소를 만들기 위해 말합니다. 적대적 토토 커뮤니티리즘은 완전히 다른 주제입니다. 또한, 우리는 적의 목표는 (a) 기계 학습을 너무 많은 오류를 생성하도록하는 것이 유용하다고 가정 할 수 있습니다. 또는 (b) 나쁜 결정이나 예측에 대한 토토 커뮤니티리즘에 영향을 미칩니다.

두 적대적 데이터 시나리오의 강력한 예는 스팸 이메일입니다. 스패머는 시간이 지남에 따라 정교한 대적 툴킷을 갖도록 진화했습니다. 예를 들어, 스팸 이메일은 필터링 메커니즘이 읽을 수 없도록 콘텐츠를 변환 할 것임을 토토 커뮤니티 커뮤니티 있습니다. Base64 이메일 본문의 인코딩은 전형적인 예입니다. 스팸은 또한 HTML 렌더링 된 컨텐츠의 숨겨진 또는 모호한 픽셀을 포함하여 복잡한 특성 및 단어 변환을 발전 시켰습니다. 또한 이러한 이메일은 종종 콘텐츠 (예 : 단어 나 문구 누락) 또는 의도적으로 기능 (예 : 틀린)을 손상시킵니다. 그러나 우리의 스팸 적 대적들이 만든 발전에도 불구하고 스팸 이메일은 수년에 걸쳐 극적인 감소를 경험했습니다.

그것에 대해해야 할 일

감소는 최악의 것으로 가정 한 기계 학습 토토 커뮤니티리즘에 크게 기인합니다. 더 정확하게는 스팸이 적은 스팸은 합법적 인 이메일과 악의적 인 이메일을 식별 할 수있는 능력을 습득 한 기계 학습 분류의 결과입니다. 근본적으로, 그러한 결정의 위업은 두 가지 방법 중 하나로 달성됩니다.

Jason_pittman

먼저, 우리는 간단히 말해서, 간단히 말해서, 우리의 분류 기능과 레이블이 적대적 조건에서 어떻게 행동하는지 시뮬레이션 할 수 있습니다. 그런 다음 토토 커뮤니티리즘은 교육 모델이 해당 방향으로 이어지지 않도록합니다. 이 시점에서 좋은 질문은 토토 커뮤니티리즘이 합법적이거나 악의적 인 결정으로 이어지는 모델을 배우는 방법을 묻는 것입니다. 글쎄, 미스터리는 쉽게 없어 질 수 있습니다 : 성능 비용. 우리는 전에 비용 기능을 본 적이 있습니다. 기억하십니까?

두 번째, 토토 커뮤니티리즘은 기능을 강력하게 선택하고보다 탄력적이고 독살하기 어려운 요소를 사용할 수 있습니다. 이상하게 도이 맥락에서 견고성과 탄력성은 사용을 의미 할 수 있습니다.eNect직관적으로 생각하는 것과는 반대로 일치하는 기준은 일치하는 기준을보다 구조적으로보다 정확하게 만들 수 있습니다. 나는 단순한 서명 목록이기 때문에 특정 단어에 대한 모든 철자를 추적한다는 의미는 아닙니다. 오히려 토토 커뮤니티리즘에가 있다고 제안합니다.퍼지단어 구조, 문법 규칙 등. 이것을 문법과 같은 문법 또는 스타일 감지 도구로 생각하지만 스팸 이메일을 위해서는 이것을 생각하십시오.

다음 다음에

자연스럽게, 토토 커뮤니티리즘이 문법이든 현대적인 스팸 이메일 필터인지 여부에 관계없이 적대 조건에 대한 솔루션은 데이터 의존적입니다. 따라서 강력한 기계 학습 토토 커뮤니티리즘의 개념은 우리가 시작한 위치, 데이터로 돌아갑니다. 다음에 교육 및 테스트 데이터의 무결성을 보장하는 방법을 살펴보고 중독되지 않도록합니다.