Линейная регрессия против логистической
В статистическом анализе важно определить отношения между переменными, относящимися к исследованию. Иногда это может быть единственной целью самого анализа. Одним из эффективных инструментов, используемых для установления наличия взаимосвязи и определения взаимосвязи, является регрессионный анализ.
Простейшей формой регрессионного анализа является линейная регрессия, где связь между переменными является линейной зависимостью. С точки зрения статистики, он выявляет взаимосвязь между независимой переменной и переменной ответа. Например, с помощью регрессии мы можем установить связь между ценой на товар и потреблением на основе данных, собранных из случайной выборки. Регрессионный анализ создаст функцию регрессии набора данных, которая представляет собой математическую модель, которая наилучшим образом соответствует имеющимся данным. Это легко представить в виде диаграммы рассеяния. Графически регрессия эквивалентна поиску кривой, наиболее подходящей для данного набора данных. Функция кривой - это функция регрессии. Используя математическую модель, можно спрогнозировать использование товара по заданной цене.
Поэтому регрессионный анализ широко используется в прогнозировании и прогнозировании. Он также используется для установления взаимосвязей в экспериментальных данных в областях физики, химии и многих естественных и инженерных дисциплин. Если отношение или функция регрессии является линейной функцией, тогда процесс известен как линейная регрессия. На диаграмме рассеяния ее можно представить в виде прямой линии. Если функция не является линейной комбинацией параметров, то регрессия нелинейна.
Логистическая регрессия сравнима с многомерной регрессией, и она создает модель, объясняющую влияние нескольких предикторов на переменную ответа. Однако в логистической регрессии переменная конечного результата должна быть категориальной (обычно разделенной; т. Е. Пара достижимых результатов, таких как смерть или выживание, хотя специальные методы позволяют моделировать более категоризованную информацию). Переменная непрерывного результата может быть преобразована в категориальную переменную, которая будет использоваться для логистической регрессии; тем не менее, сокращение непрерывных переменных таким образом в основном не рекомендуется, поскольку это снижает точность.
В отличие от линейной регрессии, в направлении к среднему, переменные-предикторы в логистической регрессии не обязательно должны быть линейно связаны, обычно распределены или иметь одинаковую дисперсию внутри каждого кластера. В результате связь между предиктором и переменными результата вряд ли будет линейной функцией.
В чем разница между логистической и линейной регрессией?
• В линейной регрессии предполагается линейная связь между независимой переменной и переменной ответа, и параметры, удовлетворяющие модели, находят путем анализа, чтобы получить точную взаимосвязь.
• Линейная регрессия выполняется для количественных переменных, и результирующая функция является количественной.
• В логистической регрессии используемые данные могут быть категориальными или количественными, но результат всегда категориален.