Разница между KDD и интеллектуальным анализом данных

Разница между KDD и интеллектуальным анализом данных
Разница между KDD и интеллектуальным анализом данных

Видео: Разница между KDD и интеллектуальным анализом данных

Видео: Разница между KDD и интеллектуальным анализом данных
Видео: Настя и сборник весёлых историй 2024, Ноябрь
Anonim

KDD против интеллектуального анализа данных

KDD (обнаружение знаний в базах данных) - это область информатики, которая включает инструменты и теории, помогающие людям извлекать полезную и ранее неизвестную информацию (т.е. знания) из больших коллекций оцифрованных данных. KDD состоит из нескольких шагов, и Data Mining - один из них. Data Mining - это применение определенного алгоритма для извлечения закономерностей из данных. Тем не менее, KDD и Data Mining используются как взаимозаменяемые.

Что такое КДД?

Как упоминалось выше, KDD - это область компьютерных наук, которая занимается извлечением ранее неизвестной и интересной информации из необработанных данных. KDD - это весь процесс попытки понять данные путем разработки соответствующих методов или приемов. Этот процесс имеет дело с отображением низкоуровневых данных в другие формы, более компактные, абстрактные и полезные. Это достигается путем создания коротких отчетов, моделирования процесса генерации данных и разработки прогнозных моделей, которые могут предсказывать будущие случаи. Из-за экспоненциального роста данных, особенно в таких областях, как бизнес, KDD стал очень важным процессом для преобразования этого огромного объема данных в бизнес-аналитику, поскольку ручное извлечение шаблонов стало казаться невозможным в последние несколько десятилетий. Например,В настоящее время он используется для различных приложений, таких как анализ социальных сетей, обнаружение мошенничества, наука, инвестиции, производство, телекоммуникации, очистка данных, спорт, поиск информации и в основном для маркетинга. KDD обычно используется для ответа на такие вопросы, как: какие основные продукты могут помочь получить высокую прибыль в следующем году в Wal-Mart ?. Этот процесс состоит из нескольких этапов. Он начинается с развития понимания предметной области приложения и цели, а затем создания целевого набора данных. Затем следует очистка, предварительная обработка, сокращение и проецирование данных. Следующим шагом является использование интеллектуального анализа данных (поясняется ниже) для определения закономерности. Наконец, обнаруженные знания консолидируются путем визуализации и / или интерпретации.спорт, поиск информации и в основном для маркетинга. KDD обычно используется для ответа на такие вопросы, как: какие основные продукты могут помочь получить высокую прибыль в следующем году в Wal-Mart ?. Этот процесс состоит из нескольких этапов. Он начинается с развития понимания предметной области приложения и цели, а затем создания целевого набора данных. Затем следует очистка, предварительная обработка, сокращение и проецирование данных. Следующим шагом является использование интеллектуального анализа данных (поясняется ниже) для определения закономерности. Наконец, обнаруженные знания консолидируются путем визуализации и / или интерпретации.спорт, поиск информации и в основном для маркетинга. KDD обычно используется для ответа на такие вопросы, как основные продукты, которые могут помочь в получении высокой прибыли в следующем году в Wal-Mart ?. Этот процесс состоит из нескольких этапов. Он начинается с развития понимания предметной области приложения и цели, а затем создания целевого набора данных. Затем следует очистка, предварительная обработка, сокращение и проецирование данных. Следующим шагом является использование интеллектуального анализа данных (поясняется ниже) для определения закономерности. Наконец, обнаруженные знания консолидируются путем визуализации и / или интерпретации. Он начинается с развития понимания предметной области приложения и цели, а затем создания целевого набора данных. Затем следует очистка, предварительная обработка, сокращение и проецирование данных. Следующим шагом является использование интеллектуального анализа данных (поясняется ниже) для определения закономерности. Наконец, обнаруженные знания консолидируются путем визуализации и / или интерпретации. Он начинается с развития понимания предметной области приложения и цели, а затем создания целевого набора данных. Затем следует очистка, предварительная обработка, сокращение и проецирование данных. Следующим шагом является использование интеллектуального анализа данных (поясняется ниже) для определения закономерности. Наконец, обнаруженные знания консолидируются путем визуализации и / или интерпретации.

Что такое интеллектуальный анализ данных?

Как упоминалось выше, интеллектуальный анализ данных - это только шаг в общем процессе KDD. Есть две основные цели интеллектуального анализа данных, определяемые целью приложения, а именно: проверка или обнаружение. Верификация - это проверка гипотезы пользователя о данных, в то время как обнаружение автоматически обнаруживает интересные закономерности. Существует четыре основных задачи интеллектуального анализа данных: кластеризация, классификация, регрессия и ассоциация (суммирование). Кластеризация - это определение похожих групп на основе неструктурированных данных. Классификация - это правила обучения, которые можно применять к новым данным. Регрессия - это поиск функций с минимальной ошибкой для моделирования данных. А ассоциация ищет отношения между переменными. Затем необходимо выбрать конкретный алгоритм интеллектуального анализа данных. В зависимости от цели используются разные алгоритмы, такие как линейная регрессия, логистическая регрессия,могут быть выбраны деревья решений и Наивный Байес. Затем ищутся интересующие шаблоны в одной или нескольких формах представления. Наконец, модели оцениваются либо с использованием предсказательной точности, либо с точки зрения понятности.

В чем разница между KDD и Data Mining?

Хотя два термина KDD и Data Mining широко используются как взаимозаменяемые, они относятся к двум связанным, но немного различным концепциям. KDD - это общий процесс извлечения знаний из данных, в то время как Data Mining - это этап внутри процесса KDD, который занимается выявлением шаблонов в данных. Другими словами, интеллектуальный анализ данных - это всего лишь применение определенного алгоритма, основанного на общей цели процесса KDD.

Рекомендуем: