Бинарная классификация — это задача классификации входных данных на две группы, обычно обозначаемые как 'положительная' и 'отрицательная'. Обучение модели классификации обычно требует наличия как положительных, так и отрицательных примеров. Однако часто встречаются задачи, где доступны только положительные примеры. Это может быть обусловлено различными причинами, например, сложностью получения отрицательных меток или высокой стоимостью их идентификации.

Подходы к решению задачи

  1. Использование метода аугментации данных


    Аугментация данных предполагает искусственный рост объема данных путем добавления синтетических примеров. В случае, когда только положительные примеры известны, может быть использован метод генерации отрицательных примеров с помощью разнообразных техник, таких как метод ближайших соседей или генеративные модели.

  2. Приближенное обучение


    В некоторых случаях можно оценить вероятностное распределение положительных примеров и использовать его для генерации отрицательных примеров. Это может быть достигнуто с использованием алгоритмов машинного обучения, таких как кластеризация.

  3. Методы одно-классового обучения


    Одно-классовое обучение фокусируется на изучении свойств единственного класса (положительного) и последующей идентификации всего остального как аномалий. Технически это возможно применением методов, таких как One-Class SVM или Isolation Forest.

  4. Полуподконтрольное обучение


    Полуподконтрольное обучение — это подход, который использует доступные немаркированные данные для улучшения представления выборки. При этом используется небольшое количество известных положительных и минимально требуемое количество немаркированных примеров для построения эффективной модели.

Разработка наиболее подходящего метода для конкретной задачи требует экспериментов и глубокого анализа данных.

Ключевые слова: бинарная классификация, положительные примеры, машинное обучение.


Категория: Машинное обучение

Теги: бинарная классификация, машинное обучение, положительные примеры