Анализ тестовых материаловРефераты >> Математика >> Анализ тестовых материалов
Коэффициент надежности теста К определяется следующим соотношением:
Если данное отношение близко к 0, то интерпретация результатов является ненадежной, если коэффициент близок к 1, то он является надежным. Следует отметить, что коэффициент надежности характеризует не только сам тест, но является и критерием оценки выборки испытуемых.
Для вычисления надежности теста используется коэффициент корреляции Пирсона между результатами двух параллельных тестов, что можно продемонстрировать, используя данные представленные в таблице 1.
Таблица 1.
№ cтудента (i) | Индивидуальный балл по тесту X | Индивидуальный балл по тесту Y |
| X2 | Y2 |
1 | X1 | Y1 | X1 Y1 | X12 | Y12 |
2 | X2 | Y2 | X2 Y2 | X22 | Y22 |
… | … | …. | …. | …. | …. |
N | Xn | Yn | Xn Yn | Xn2 | Yn2 |
∑ | ∑Xi | ∑Yi | ∑XiYi | ∑ Xi2 | ∑ Yi2 |
При оценке надежности теста по двум половинам расщепленного теста используется формула Спирмена-Брауна [10]:
,
где К - надежность всего теста, а - надежность, вычисленная по двум половинам теста, причем вычисляется как коэффициент корреляции Пирсона. При этом необходимо подсчитывать баллы испытуемых отдельно для четных и для нечетных заданий теста (табл. 2).
Таблица 2.
№ (i) | Индивидуальный балл по нечетным заданиям теста | Индивидуальный балл по четным заданиям теста |
| X2 |
Y2 |
1 | X1 | Y1 | X1Y1 | X12 |
Y12 |
2 | X2 | Y2 | X2Y2 | X22 |
Y22 |
… | … | …. | …. | …. |
…. |
N | Xn | Yn | Xn Yn | Xn2 |
Yn2 |
∑ | ∑Xi | ∑Yi | ∑ XiYi | ∑ Xi2 | ∑ Yi2 |
Однако наибольшее распространение на практике получило применение для расчета надежности теста так называемой формулы KR-20 [17]:
,
где К- коэффициент надежности, m- число заданий в тесте, pj - доля правильных ответов на j задание, qj - доля неправильных ответов на j задание. Дисперсия индивидуальных баллов N студентов вычисляется по формуле:
.
Если величина коэффициента надежности К составляет от 0,90 до 0,99, то тест имеет отличную оценку надежности, если от 0,80 до 0,89 то хорошую, от 0,70 до 0,79 – удовлетворительную и менее 0,69 - неудовлетворительную надежность. По формуле KR20 оценивается надежность таких тестов как SAT (K = 0,91) и TOEFL (К = 0,93). По данным для текущего контроля знаний необходимо, чтобы тест имел надежность не менее 0,80, а для итоговой аттестации более 0,90.
При оценке качества заданий важно понять, существует ли тенденция, когда одни и те же ученики добиваются успеха в какой-либо паре заданий теста? Либо, наоборот, такой тенденции, указывающей на связь результатов, нет, и состав учеников, добивающихся успеха, полностью меняется при переходе от одного задания к другому в тесте. Для ответа на поставленные вопросы необходимо провести анализ данных, собрав их в таблицу.