Например, классифицируем что-то как «носки» из нашего предыдущего примера.
Повседневным применением алгоритма предиктивной классификации является детектор спама в электронных письмах, который определяет атрибуты, помогающие ему отнести электронное письмо к категории «спам» или «не спам».
Важно уметь определять, относится ли особенности нашей базы данных по рекламе проблема к классификации или регрессии.
(i) Примеры можно отнести к одному из двух или более классов
(ii) Проблему с двумя классами можно также назвать бинарной проблемой.
(iii) Проблему с более чем двумя классами можно назвать проблемой многоклассовой классификации.
На следующем рисунке показана типичная задача классификации, в которой переменная «категоризируется» либо в категории «кошки», либо в категории «собаки».
Из линии границы также видно, что были допущены некоторые ошибки при классификации некоторых собак как кошек и наоборот.
Эта проблема возникает в случаях, когда атрибуты могут быть схожими, например, когда рост является одним из критериев классификации, а некоторые породы собак могут иметь более короткие тела.
Чем больше размер обучающих данных, тем меньше вероятность ошибки.
Характеристики задачи классификации:
-
hasinam2206
- Posts: 393
- Joined: Sun Dec 22, 2024 4:47 am