Ключевое различие между кластеризацией и классификацией заключается в том, что кластеризация - это метод обучения без учителя, который группирует похожие экземпляры на основе характеристик, тогда как классификация - это метод обучения с учителем, который присваивает экземплярам предопределенные теги на основе характеристик.
Хотя кластеризация и классификация кажутся похожими процессами, между ними есть различие, основанное на их значении. В мире интеллектуального анализа данных кластеризация и классификация - это два типа методов обучения. Оба эти метода характеризуют объекты в группы по одному или нескольким признакам.
СОДЕРЖАНИЕ
1. Обзор и основные отличия
2. Что такое кластеризация
3. Что такое классификация
4. Сравнение бок о бок - кластеризация и классификация в табличной форме
5. Резюме
Что такое кластеризация?
Кластеризация - это метод группировки объектов таким образом, что объекты со схожими характеристиками объединяются, а объекты с разными характеристиками расходятся. Это распространенный метод статистического анализа данных для машинного обучения и интеллектуального анализа данных. Исследовательский анализ и обобщение данных - это также область, в которой используется кластеризация.
Рисунок 01: Кластеризация
Кластеризация относится к неконтролируемому интеллектуальному анализу данных. Это не какой-то конкретный алгоритм, а общий метод решения задачи. Следовательно, можно добиться кластеризации с использованием различных алгоритмов. Соответствующий алгоритм кластера и настройки параметров зависят от отдельных наборов данных. Это не автоматическая задача, это итеративный процесс открытия. Следовательно, необходимо изменять обработку данных и моделирование параметров до тех пор, пока результат не достигнет желаемых свойств. Кластеризация K-средних и иерархическая кластеризация - это два распространенных алгоритма кластеризации в интеллектуальном анализе данных.
Что такое классификация?
Классификация - это процесс категоризации, который использует обучающий набор данных для распознавания, различения и понимания объектов. Классификация - это метод обучения с учителем, при котором доступны обучающая выборка и правильно определенные наблюдения.
Рисунок 02: Классификация
Алгоритм, реализующий классификацию, - это классификатор, тогда как наблюдения - это экземпляры. Алгоритм K-ближайшего соседа и алгоритмы дерева решений - самые известные алгоритмы классификации в интеллектуальном анализе данных.
В чем разница между кластеризацией и классификацией?
Кластеризация - это обучение без учителя, а классификация - это метод обучения с учителем. Он группирует похожие экземпляры на основе функций, тогда как классификация присваивает экземплярам заранее определенные теги на основе функций. Кластеризация разбивает набор данных на подмножества, чтобы сгруппировать экземпляры с похожими функциями. Он не использует размеченные данные или обучающий набор. С другой стороны, классифицируйте новые данные в соответствии с наблюдениями обучающего набора. Обучающий набор помечен.
Цель кластеризации - сгруппировать набор объектов, чтобы выяснить, существуют ли между ними какие-либо отношения, тогда как классификация направлена на то, чтобы найти, к какому классу принадлежит новый объект, из набора предопределенных классов.
Резюме - Кластеризация против классификации
Кластеризация и классификация могут показаться похожими, поскольку оба алгоритма интеллектуального анализа данных делят набор данных на подмножества, но это два разных метода обучения интеллектуального анализа данных для получения надежной информации из набора необработанных данных. Разница между кластеризацией и классификацией заключается в том, что кластеризация - это метод обучения без учителя, который группирует похожие экземпляры на основе характеристик, тогда как классификация - это метод обучения с учителем, который назначает предопределенные теги экземплярам на основе характеристик.
Изображение предоставлено:
1. «Кластер-2» от Cluster-2.gif: производная работа hellisp: (общественное достояние) через Wikimedia Commons 2. «Магнетизм» Джона Аплесседа - собственная работа. (Общественное достояние) через Wikimedia Commons