Бинарная классификация — это задача классификации входных данных на две группы, обычно обозначаемые как 'положительная' и 'отрицательная'. Обучение модели классификации обычно требует наличия как положительных, так и отрицательных примеров. Однако часто встречаются задачи, где доступны только положительные примеры. Это может быть обусловлено различными причинами, например, сложностью получения отрицательных меток или высокой стоимостью их идентификации.
Подходы к решению задачи
Использование метода аугментации данных
Аугментация данных предполагает искусственный рост объема данных путем добавления синтетических примеров. В случае, когда только положительные примеры известны, может быть использован метод генерации отрицательных примеров с помощью разнообразных техник, таких как метод ближайших соседей или генеративные модели.
Приближенное обучение
В некоторых случаях можно оценить вероятностное распределение положительных примеров и использовать его для генерации отрицательных примеров. Это может быть достигнуто с использованием алгоритмов машинного обучения, таких как кластеризация.
Методы одно-классового обучения
Одно-классовое обучение фокусируется на изучении свойств единственного класса (положительного) и последующей идентификации всего остального как аномалий. Технически это возможно применением методов, таких как One-Class SVM или Isolation Forest.
Полуподконтрольное обучение
Полуподконтрольное обучение — это подход, который использует доступные немаркированные данные для улучшения представления выборки. При этом используется небольшое количество известных положительных и минимально требуемое количество немаркированных примеров для построения эффективной модели.
Разработка наиболее подходящего метода для конкретной задачи требует экспериментов и глубокого анализа данных.
Ключевые слова: бинарная классификация, положительные примеры, машинное обучение.
Категория: Машинное обучение
Теги: бинарная классификация, машинное обучение, положительные примеры
- Как решать задачу бинарной классификации, зная только положительные примеры? - Stack Overflow на русском
- Как решать задачу бинарной классификации, зная только положительные примеры? — Яндекс Кью
- Необходимость балансирования положительных / отрицательных примеров в машинном обучении бинарной классификации? - GeeksforGeeks
- Решение простой задачи бинарной классификации | Машинное обучение
- Как заставить работать бинарный классификатор чуточку лучше / Хабр