Стандартное отклонение от среднего
В описательной и логической статистике используются несколько индексов для описания набора данных, соответствующего его центральной тенденции, дисперсии и асимметрии. В статистическом выводе они обычно называются оценками, поскольку они оценивают значения параметров совокупности.
Центральная тенденция указывает на центр распределения ценностей. Среднее значение, мода и медиана - это наиболее часто используемые индексы при описании центральной тенденции набора данных. Дисперсия - это объем разброса данных из центра распределения. Диапазон и стандартное отклонение - наиболее часто используемые меры дисперсии. Коэффициенты асимметрии Пирсона используются для описания асимметрии распределения данных. Здесь асимметрия относится к тому, является ли набор данных симметричным относительно центра или нет, и если нет, насколько он искажен.
Что это означает?
Среднее - это наиболее часто используемый индекс центральной тенденции. Для данного набора данных среднее значение вычисляется путем взятия суммы всех значений данных и последующего деления ее на количество данных. Например, вес 10 человек (в килограммах) составляет 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тогда средний вес десяти человек (в килограммах) может быть равен рассчитывается следующим образом. Сумма весов составляет 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Среднее значение = (сумма) / (количество данных) = 710/10 = 71 (в килограммах).
Как и в этом конкретном примере, среднее значение набора данных может не быть точкой данных набора, но будет уникальным для данного набора данных. Среднее значение будет иметь те же единицы, что и исходные данные. Следовательно, он может быть отмечен на той же оси, что и данные, и может использоваться при сравнении. Кроме того, нет ограничений по знаку для среднего значения набора данных. Оно может быть отрицательным, нулевым или положительным, поскольку сумма набора данных может быть отрицательной, нулевой или положительной.
Что такое стандартное отклонение?
Стандартное отклонение - это наиболее часто используемый показатель дисперсии. Чтобы вычислить стандартное отклонение, сначала рассчитываются отклонения значений данных от среднего. Среднеквадратическое значение отклонений называется стандартным отклонением.
В предыдущем примере соответствующие отклонения от среднего: (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 и (79-71) = 8. Сумма квадраты отклонения равны (-1) 2+ (-9) 2 + (-6) 2 + 1 2 +9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366 Стандартное отклонение √ (366/10) = 6,05 (в килограммах). Из этого можно сделать вывод, что большая часть данных находится в интервале 71 ± 6,05, при условии, что набор данных не сильно искажен, и это действительно так в данном конкретном примере.
Поскольку стандартное отклонение имеет те же единицы, что и исходные данные, оно дает нам меру того, насколько данные отклонены от центра; больше стандартное отклонение больше дисперсия. Кроме того, стандартное отклонение будет неотрицательным значением независимо от характера данных в наборе данных.
В чем разница между стандартным отклонением и средним значением? • Стандартное отклонение - это мера разброса от центра, тогда как среднее значение измеряет местоположение центра набора данных. • Стандартное отклонение всегда неотрицательное значение, но среднее может принимать любое действительное значение. |