Основные принципы построения статистических показателей и их видыРефераты >> Статистика >> Основные принципы построения статистических показателей и их виды
Виды вариации и система показателей вариации
1. Если изучаемый признак может принять только одно из двух значений, противоположных по своей сути, то вариация называется альтернативной. Например, если изучается совокупность населения мужского пола, то по признаку прохождения службы в рядах российской армии всех мужчин можно разделить на две группы: проходившие службу, и не проходившие ее. Или в случае рассмотрения домохозяйств города по признаку наличия жилья в частной собственности все домохозяйства можно разделить на группу, обладающих жильем в частной собственности, и на группу домохозяйств, не обладающих таковым.
2. Систематическая вариация – изменение признака в определенном направлении. Вариация является систематической, только если изменение явления в определенном направлении не обусловлено внутренними законами развития изучаемого явления.
3. Случайной называется вариация, не имеющая явно выраженного направления, т.е. изменчивость признака при случайной вариации не предсказуема.
Изменчивость явления в статистическом анализе отображается с помощью целого ряда характеристик, называемых системой показателей вариации. В систему показателей вариации входят:
Абсолютные показатели вариации:
1) размах вариации;2) средние величины (групповые и общие):
а) степенные средние величины;б) структурные средние величины;
3) среднее линейное отклонение;
4) дисперсии (групповая, межгрупповая и общая) и среднее квадратическое отклонение;
Относительные показатели вариации:
1) коэффициент осцилляции;2) коэффициенты вариации (в том числе линейный);3) коэффициенты детерминации (эмпирические и теоретические).
Абсолютные показатели вариации
Абсолютные показатели вариации непосредственно характеризуют изменчивость исследуемой совокупности, тогда как относительные показатели вариации являются результатом сопоставления абсолютных.
В состав абсолютных показателей вариации включаются:
Размах вариации (R), отражает пределы изменчивости признака или, другими словами, амплитуду вариации. Размах вариации рассчитывается как разность между максимальной величиной признака (xmax) и минимальной величиной признака (xmin), т.е. по формуле:
Размах вариации всегда выражается в единицах измерения того признака, степень колеблемости которого он отражает.
Среднее линейное отклонение ( ) – величина, отражающая среднее отклонение от среднего значения в совокупности. Другими словами, среднее линейное отклонение показывает диапазон, в котором лежит основная масса значений признака вокруг средней величины. Поскольку сумма отклонений от средней величины равна нулю, поэтому для расчета среднего линейного отклонения применяется модуль. Если при изучении признака не учитываются другие факторы, то среднее линейное отклонение рассчитывается как:
хi – индивидуальные значения исследуемого признака; – среднее значение исследуемого признака; n – число единиц в совокупности.
Если в исследовании принимается во внимание признак-вес, то среднее линейное отклонение рассчитывается как: хi – индивидуальные значения исследуемого признака; – среднее значение исследуемого признака; f – индивидуальные значения признака-фактора; f– суммарная величина признака-фактора.
Среднее линейное отклонение имеет такие же единицы измерения, как индивидуальные значения признака.
Чем больше значение среднего линейного отклонения по сравнению с величиной среднего значения совокупности, тем больше диапазон, в котором сосредоточена основная масса отдельных значений исследуемого признака. То есть, отдельные единицы совокупности имеют большой разброс вокруг среднего значения, и совокупность неоднородна.
Применение модуля при расчете среднего линейного отклонения накладывает ряд ограничений на дальнейшие математические действия с данной величиной. Поэтому на практике, как правило, применяется среднее квадратическое отклонение, рассчитываемое как корень квадратный из дисперсии. Формулы этих показателей имеют следующий вид:
а) если исследуется только один признак:
б) для исследования с учетом влияния признака, влияющего на изучаемый (признака-веса):
То есть, в данных показателях функцию модуля выполняет возведение в квадрат отклонений индивидуальных значений признака от средней.
В литературе, издаваемой за рубежом, среднее квадратическое отклонение (СКО) называется Standard Deviation (SD). Данный показатель рассчитывается в тех же единицах, что и изучаемый признак. Суть СКО схожа со средним линейным отклонением, то есть она состоит в определении среднего размера разброса значений признака вокруг средней.
Практическое применение СКО и среднего линейного отклонения выявило определенную взаимосвязь между данными показателями: при распределении близком к нормальному первый всегда больше последнего. Объяснятся это теми же причинами, что и изменение размерности степенной средней с изменением показателя степени. То есть, согласно правилу мажорантности, чем больше степень средней величины, тем больше ее значение. Для отклонений от средней действует этот же принцип: среднее квадратическое отклонение имеет вторую степень, а линейное среднее отклонение – первую. Соотношение между СКО и средним линейным отклонением при нормальном или симметричном распределении можно выразить следующим образом:
Расчет дисперсии имеет особое значение для анализа совокупности, поскольку все отклонения от среднего значения усиливаются возведением в квадрат. Поэтому чем менее однородна совокупность, тем большее значение будет иметь дисперсия.
Существует второй способ расчета дисперсии с помощью моментов. Опустим математический вывод тождества двух вариантов расчета, отметим только, что в результате дисперсия рассчитывается как разность квадратов: начальный момент второго порядка минус квадрат начального момента первого порядка. Читается данная формула следующим образом: средний квадрат минус квадрат средней. То есть, второй вариант рассчитывается как:
а) если исследуется только один признак
б) для исследования с учетом влияния признака-веса: