Как решать бинарную классификацию с только положительными примерами?

MMironWin · 6 фев

Бинарная классификация — это задача классификации входных данных на две группы, обычно обозначаемые как 'положительная' и 'отрицательная'. Обучение модели классификации обычно требует наличия как положительных, так и отрицательных примеров. Однако часто встречаются задачи, где доступны только положительные примеры. Это может быть обусловлено различными причинами, например, сложностью получения отрицательных меток или высокой стоимостью их идентификации.

Подходы к решению задачи

Использование метода аугментации данных

Аугментация данных предполагает искусственный рост объема данных путем добавления синтетических примеров. В случае, когда только положительные примеры известны, может быть использован метод генерации отрицательных примеров с помощью разнообразных техник, таких как метод ближайших соседей или генеративные модели.
Приближенное обучение

В некоторых случаях можно оценить вероятностное распределение положительных примеров и использовать его для генерации отрицательных примеров. Это может быть достигнуто с использованием алгоритмов машинного обучения, таких как кластеризация.
Методы одно-классового обучения

Одно-классовое обучение фокусируется на изучении свойств единственного класса (положительного) и последующей идентификации всего остального как аномалий. Технически это возможно применением методов, таких как One-Class SVM или Isolation Forest.
Полуподконтрольное обучение

Полуподконтрольное обучение — это подход, который использует доступные немаркированные данные для улучшения представления выборки. При этом используется небольшое количество известных положительных и минимально требуемое количество немаркированных примеров для построения эффективной модели.

Разработка наиболее подходящего метода для конкретной задачи требует экспериментов и глубокого анализа данных.

Ключевые слова: бинарная классификация, положительные примеры, машинное обучение.

Категория: Машинное обучение

Теги: бинарная классификация, машинное обучение, положительные примеры