Регрессия против ANOVA
Регрессия и ANOVA (дисперсионный анализ) - это два метода в статистической теории для анализа поведения одной переменной по сравнению с другой. В регрессии это часто вариация зависимой переменной на основе независимой переменной, тогда как в ANOVA это вариация атрибутов двух выборок из двух популяций.
Подробнее о регрессии
Регрессия - это статистический метод, используемый для установления связи между двумя переменными. Часто при сборе данных могут быть переменные, которые зависят от других. Точная связь между этими переменными может быть установлена только методами регрессии. Определение этой связи помогает понять и предсказать поведение одной переменной по отношению к другой.
Наиболее распространенное применение регрессионного анализа - оценка значения зависимой переменной для данного значения или диапазона значений зависимых переменных. Например, с помощью регрессии мы можем установить связь между ценой на товар и потреблением на основе данных, собранных из случайной выборки. Регрессионный анализ создаст функцию регрессии набора данных, которая представляет собой математическую модель, которая наилучшим образом соответствует имеющимся данным. Это легко представить в виде диаграммы рассеяния. Графически регрессия эквивалентна нахождению наилучшей кривой для заданного набора данных. Функция кривой - это функция регрессии. Используя математическую модель, можно спрогнозировать использование товара по заданной цене.
Поэтому регрессионный анализ широко используется в прогнозировании и прогнозировании. Он также используется для установления взаимосвязей в экспериментальных данных в областях физики, химии и многих естественных и технических дисциплин. Если отношение или функция регрессии является линейной функцией, тогда процесс известен как линейная регрессия. На диаграмме рассеяния ее можно представить в виде прямой линии. Если функция не является линейной комбинацией параметров, то регрессия нелинейна.
Подробнее о ANOVA (дисперсионный анализ)
ANOVA не включает явный анализ связи между двумя или более переменными. Скорее, он проверяет, имеют ли две или более выборки из разных популяций одно и то же среднее значение. Например, рассмотрим результаты экзамена, проведенного за класс в школе. Несмотря на то, что тесты разные, производительность может быть одинаковой от класса к классу. Один из способов проверить это - сравнить средства каждого класса. ANOVA или анализ отклонений позволяет проверить эту гипотезу. По сути, ANOVA можно рассматривать как расширение t-критерия, когда сравниваются средние значения двух выборок, взятых из двух популяций.
Фундаментальная идея ANOVA состоит в том, чтобы рассмотреть вариации внутри выборки и вариации между выборками. Различия внутри выборки можно отнести к случайности, тогда как вариации между выборками можно отнести как к случайности, так и к другим внешним факторам. Дисперсионный анализ основан на трех моделях; модель фиксированных эффектов, модель случайных эффектов и модель смешанных эффектов.
В чем разница между регрессией и ANOVA?
• ANOVA - это анализ вариации между двумя или более образцами, а регрессия - это анализ связи между двумя или более переменными.
• Теория дисперсионного анализа применяется с использованием трех основных моделей (модель с фиксированными эффектами, модель со случайными эффектами и модель со смешанными эффектами), тогда как регрессия применяется с использованием двух моделей (модель линейной регрессии и модель множественной регрессии).
• ANOVA и регрессия - это две версии общей линейной модели (GLM). ANOVA основан на категориальных переменных-предикторах, а регрессия основана на количественных переменных-предикторах.
• Регрессия - более гибкий метод, который используется для прогнозирования и прогнозирования, в то время как ANOVA используется для сравнения равенства двух или более популяций.