Статистическое изучение основных фондов
Необходимо:
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
2. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Степень износа основных фондов в отрасли - строительство.
1. Строим диаграмму рассеяния – точечный график, осям X и Y которого сопоставлены два изучаемых признака единиц совокупности. Построение данной диаграммы в среде Excel осуществляется следующим образом: выделяем оба столбца B4:C34, далее Вставка – Диаграмма – Точечная - Готово, в ней данные первого столбца (Степень износа основных фондов в отрасли – строительство) автоматически сопоставляются оси X, данные второго столбца (Стоимость основных фондов в отрасли - строительство) - оси Y. Для поиска аномальных значений визуально находятся аномальные точки. При подведении к ним курсора появляется надпись, содержащая значения признаков этого наблюдения в формате (X;Y).
На рисунке 1 чётко видим точки, которые отстоят от основной массы точек на существенном расстоянии. Каждый «выброс» из этой массы означает аномальность единицы наблюдения либо по признаку X, либо по признаку Y.
Рис. 1. Аномальные значения признаков на диаграмме рассеяния.
В таком случае такие единицы подлежат удалению из первичных данных. Но перед этим их необходимо скопировать в таблицу 2.
Таблица 2.
Аномальные единицы наблюдения
Регионы России |
Степень износа основных фондов в отрасли - строительство, млн. руб. |
Стоимость основных фондов в отрасли - строительство, млн. руб. |
г. Москва |
36129.47 |
91467.00 |
Рязанская область |
16539.89 |
27939.00 |
Московская область |
11199.97 |
25688.00 |
г. Санкт - Петербург |
5826.66 |
13873.00 |
Белгородская область |
3224.47 |
11005.00 |
В данной задаче 5 аномальных единиц наблюдения.
Для удаления из исходной таблицы 1 строк с аномальными данными необходимо выделить мышью соответствующую адресную строку вместе с её номером, нажать Правка – Удалить. В итоге получаем табл. 1 и рис. 2:
Рис. 2. Диаграмма рассеяния без аномальных единиц.
Таблица 1. Исходные данные
Регионы России |
Степень износа основных фондов в отрасли – строительство, млн. руб. |
Стоимость основных фондов в отрасли - строительство, млн. руб. |
Брянская область |
758.01 |
1919.00 |
Владимирская область |
1092.50 |
2595.00 |
Воронежская область |
1479.63 |
3182.00 |
Ивановская область |
386.60 |
1065.00 |
Калужская область |
733.04 |
1870.00 |
Костромская область |
953.56 |
1516.00 |
Курская область |
216.90 |
1446.00 |
Липецкая область |
797.87 |
1797.00 |
Орловская область |
1109.12 |
1733.00 |
Смоленская область |
1195.29 |
2330.00 |
Тамбовская область |
836.61 |
1855.00 |
Тверская область |
814.43 |
1642.00 |
Тульская область |
989.33 |
2413.00 |
Ярославская область |
2411.03 |
5044.00 |
Республика Карелия |
700.74 |
1530.00 |
Республика Коми |
2629.31 |
6351.00 |
Архангельская область |
2168.33 |
6285.00 |
Вологодская область |
1098.59 |
3319.00 |
Калининградская область |
384.71 |
747.00 |
Ленинградская область |
1971.00 |
4380.00 |
Мурманская область |
899.16 |
1905.00 |
Новгородская область |
674.08 |
1314.00 |
Псковская область |
907.41 |
2030.00 |
Республика Адыгея |
1361.26 |
2284.00 |
Республика Дагестан |
1364.97 |
2630.00 |
Республика Ингушетия |
68.54 |
149.00 |
Данный пункт необходимо выполнить, так как аномальные значения нарушают статистическую закономерность изучаемого явления. Следовательно, статистическое изучение совокупности без предварительного выявления и анализа возможных аномальных наблюдений может не только исказить значения обобщающих показателей, но и привести к серьёзным ошибкам в выводах о статистических свойствах совокупности, сделанных на основе полученных оценок показателей.
2. Для построения интервального вариационного ряда выполняем следующие действия:
1. Сервис - Анализ данных - Гистограмма - ОК
2. Входной интервал – B4:B29