Математическая статистикаРефераты >> Математика >> Математическая статистика
Предварительно образовывать не менее 12 и более 15. Меньше 12 искажает результат, более 15 затрудняет работу с таблицей.
1) Определяем размах – разницу между максимальной и минимальной оценкой (112-44=69)
2) Выбор интервала разряда: 69:12=5,75
Определяем с уменьшением до 5: 69:15=4,6
3) Определение границ раздела. Необходимо образовать достаточное количество разрядов, чтобы не потерять самую маленькую и самую большую оценки, поэтому табулирование начнем с величины кратной интервалу. Ближайшее кратное 5 ниже нижней оценки – это 40. И делим на разряды до тех пор, пока не будет охвачена самая высокая оценка. Если необходимо сравнить 2 и более выборки, их помещают в такую же таблицу.
Квантили
Квантили – это способ описать группу измерений. Квантиль – это общее понятие.
Квантиль – точка на числовой шкале, которая делит совокупность наблюдений на группы с соответствующими пропорциями в каждой из них.
Квартиль – делит наблюдения на 4 группы (Q)
Дециль – делит наблюдения на 10 групп (D)
Квинтель – делит наблюдения на 5 групп (К)
Процентиль – делит наблюдения на 100 групп (Р)
Определение процентелей
Процентель представляет собой точку, ниже которой лежит Р % - в оценок.
Вычисление процентеля
Оценка |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
0 |
8 |
9 |
7 |
6 |
5 |
4 |
Частота |
7 |
3 |
4 |
8 |
0 | ||||||||||
Накопленная частота |
25 |
24 |
23 |
20 |
15 |
06 |
8 |
1 |
8 |
6 |
4 |
Для определения 25 процентиля P25 (границы, под которой расположены 25% всех выставленных оценок)
Общая формула:
где:
n – общее число оценок
L – фактическая нижняя граница того раздела оценок, который включает себя нужную нам оценку
cumf – накопленная в данной нижней границе частота
f – количество оценок в данном разделе
p – определяемый процентиль (в данном случае 0,25)
p*n = 0,25*125=31,25
Находим фактическую нижнюю границу раздела L, содержащую 31,5 (это между 34 и 16).
Нижняя граница оценки 28,5
L=28,5 f=34-16=18
Вычитаем накопленную частоту L из произведения nf: ((31,25-16)/18) + 28,5=29,35
Для определения процентиля в случае наличия интервалов оценок, формула принимает вид:
где W – ширина любого интервала оценок (в примере =1).
Наглядное представление данных
В табличных процессорах представляется возможность оформить численные данные в виде графика или диаграммы различного вида, но разновидностей графического представления данных существует больше, чем это предусмотрено программным обеспечением и прежде чем использовать какой-либо из видов необходимо:
· выделить в данных существенную информацию;
· знать все типы представления данных и сделать правильный выбор;
· знать и грамотно использовать потенциал аудитории, для представления которой готовятся данные;
· если оформление осуществляется не вами, разработать подробные и четкие инструкции для технического персонала с учетом имеющихся средств.
Примеры диаграмм и графиков: линейная, столбиковая, полосчатая, кумулятивная кривая, данные накапливаются с течением времени, пиктограмма – данные представляются в виде стилизованных изображений (улов рыбы в виде рыбы), логарифмическая диаграмма, круговая диаграмма.
Графическое представление распределения частот
1) Столбиковая диаграмма (гистограмма)
2) Полигон распределения
3) Сглаженная кривая
Гистограмма - это последовательность столбцов, каждый из которых опирается на один раздельный интервал, а высота столбца – это частота или количество случаев.
Принято распределять горизонтальную шкалу на один раздельный интервал вправо и влево от полученного диапазона. Чтобы гистограмма не получилась сплющенной или вытянутой, выбирают такой масштаб шкалы, чтобы ее ширина составляла 1 2/3 высоты. Середина столбца совмещается с срединой интервала, на практике ее изображают в форме контура, опуская вертикальные линии.
Полигон распределения – это та же гистограмма, но линии соединяют середины столбцов каждого разрядного интервала. Так как на разрядах справа и слева от разрядов распределения частот, частота имеет нулевое значение, поэтому полигон распределения продолжают до горизонтальной оси в середине интервала ниже меньшей оценки и выше высшей оценки.
Огива производится по точкам максимально приближенно без углов или острых фигур, ее называют кривой процентелей. Точки, определяющие кривую процентелей расположены по горизонтали у верхней границы каждого раздела. Огива проходит путь от 0 до 100%. При рисовании огивы надо следить за тем (особенно при малом числе объектов), чтобы, когда мы сглаживаем кривую, над ней оставались бы столько же точек, сколько и под ней. При отсутствии любых графических средств можно создать гистограмму на пишущей машинке в виде полосчатой диаграммы.
Гистограмма наиболее легка для восприятия и используется в тех случаях когда всего одно распределение. Если надо сравнить два и более распределений, используют полигон, чтобы избежать запутанной картины.
Огива дает возможность оценить квантили, медианы и другие характеристики точки. Удобно сравнивать несколько групп данных на одном графике.
Ошибки при использовании графиков
1) при создании графика не определяли положение нулевой точки;
2) представили значения в виде площадей в том случае, когда их надо было отражать линейно;
3) при использовании небольшого количества объектов сделали вывод относительно всей совокупности.