Нормы и интерпретация результатов теста
Рефераты >> Психология >> Нормы и интерпретация результатов теста

åd2 = 82,5

Проделана обычная ранговая корреляция. По таблице уровней значимости r0,99 = 0,64; полученный коэффициент превышает эту величину. Принято считать, что коэффициент надежности не дол­жен быть ниже 0,8. Полученный коэффициент удовлетворяет этому требованию (Применение коэффициента корреляции для нахождения коэффициента на­дежности-гомогенности путем сопоставления числа правильных решений по четным заданиям и числа правильных решений по нечетным заданиям некото­рые авторы находят недостаточно корректным, поскольку порядок, в котором представлены коррелируемые ряды, может быть случайным, он может быть произвольно изменен. Однако никакого другого приема для установления этого вида надежности в «Стандартных требованиях к педагогическим и психологиче­ским тестам» не дается. Нахождение коэффициента надежности-стабильности указанной недостаточной корректностью не грешит).

Есть поправочная формула Спирмена—Брауна к коэффициенту на­дежности-гомогенности, получаемому путем расщепления. Поскольку при прочих равных условиях получаемый коэффициент будет тем вы­ше, чем больше заданий содержится в методике, следует принять во внимание, что прием расщепления уменьшает число заданий вдвое — на этом основывается данный прием. Поправочная формула

в нашем примере

где rSB — коэффициент с учетом поправки, а — коэффициент, вычисленный при коррелировании двух половинок методики. Если этот последний равен 0,88, то после поправки Спирмена—Брауна коэффициент будет равен 0,94.

Поправочную формулу Спирмена—Брауна можно применять только в тех случаях, когда методика делится на половинки (расщепление). Если же в методике в процессе обработки не меня­ют число заданий, то поправочная формула не применяется.

Величина коэффициента надежности-гомогенности зависит от со­циально-психологических особенностей той выборки, по результа­там испытания которой этот коэффициент устанавливался. Поэтому при опубликовании методики, приводя ее основные характеристики, автору следует указать, на каком контингенте проводилась проверка надежности.

При вычислении коэффициента надежности методики, характери­зующего стабильность данных, получаемых с помощью этой мето­дики, первый коррелируемый ряд представляет собой результаты первого, а второй — повторного испытания: его рекомендуют про­водить примерно через шесть недель после первого. При необходи­мости этот срок может изменяться. Эти два ряда коррелируют меж­ду собой. Корреляция проводится по обычным правилам, о них со­общалось выше. Это прием «тест-ретест».

Для установления надежности методики существуют и некоторые другие приемы. Так, для получения коэффициента надежности практикуется прием параллельных форм. Авторы, конструирующие методику, создают две ее формы; условно назовем их формой А и формой Б. Обе формы должны быть однородны по психологической направленности, по доступности содержания заданий и по их труд­ности. В одном варианте формы Л и Б предъявляются испытуемым одна за другой, причем в одной половине выборки испытуемым сна­чала предлагается форма А, а за ней форма Б, а в другой половине выборки, наоборот, сначала форма Б, а затем А. Результаты, полу­ченные по той и другой форме, коррелируют между собой, и полу­ченный коэффициент трактуется как коэффициент надежности. Не­трудно заметить, что этот прием близок приему расщепления с той разницей, что методика как бы удвоена и сравниваются не четные и нечетные задания, а две половины этой удвоенной методики. Это дает право трактовать получаемый коэффициент скорее как коэффициент надежности-гомогенности, а не надежности-стабильности. Поскольку проверке подвергается набор заданий в целом, поправочную формулу Спирмена—Брауна применять не следует.

Другой вариант использования приема параллельных форм состо­ит- в том, что одна из форм предлагается испытуемым через какой-то интервал времени после другой, что сближает этот прием с приемом «тест-ретест». При проведении этого приема необходимо убедиться в том, что обе формы высоко коррелируют между собой, согласно только что изложенному приему по надежности-Гомоген­ности. Результаты обоих испытаний затем коррелируют. Получен­ный коэффициент может трактоваться как коэффициент надежно­сти-стабильности. Выше указывалось, что в приеме «тест-ретест» рекомендуется интервал между испытаниями шесть недель. Для этого варианта приема параллельных форм этот интервал может быть уменьшен, так как испытуемый при выполнении заданий не сможет опираться на память.

Из предшествующего изложения явствует, что в приемах уста­новления надежности главную роль играет статистический метод корреляций. Несколько по-иному обстоят дела при проверке валид­ности методики.

Если показатели того критерия, который взят для получения ко­эффициента внешней валидности, имеют примерно ту же меру рас­сеяния, меру вариативности, что и мера рассеяния показателей са­мой методики, то применение корреляции правомерно. Допустим, автор методики намерен установить ее валидность, сравнивая ус­пешность выполнения методики с учебной деятельностью. Валид­ность устанавливается на выборке школьников. В этом случае, как показывает практика, суммарные оценки за одну учебную четверть или за полугодие покажут примерно тот же размах колебаний, что и размах колебаний по методике; методика состоит из 20 заданий, и при ее выполнении показан размах колебаний от 3 до 20. Суммар­ные оценки успеваемости, после того как они подсчитаны за полго­да, имеют размах колебаний порядка от 14 до 36. Такие ряды впол­не возможно коррелировать.

Но в некоторых случаях для получения коэффициента валидно­сти приходится сравнивать успешность выполнения диагностиче­ской методики, допустим, в тех же пределах колебаний — от 3 до 20, и производственные достижения, которые имеют всего три сту­пени оценок: ниже средних, средние и выше средних. Корреляцией в этом случае воспользоваться нельзя, если иметь в виду линейную корреляцию, о которой идет речь в этой главе. Однако могут быть использованы некоторые другие статистические методы, показы­вающие существование или отсутствие связи между распределени­ем двух рядов численностей. Простейший способ получения коэф­фициента валидности в описываемом случае и в других подобных случаях — метод «хи-квадрат». Всех испытуемых, прошедших диагностический эксперимент, делят на три равные группы — их и со­поставляют с тремя группами, на которые были поделены испытуе­мые при оценке их профессиональной успеваемости.

В изучаемой выборке — 90 человек. Они делятся по профессио­нальным достижениям на три группы: первая — в ней 30 испытуе­мых — лица с профессиональными достижениями ниже среднего уровня; вторая — 40 испытуемых — это лица со средними дости­жениями, и третья — 20 испытуемых, их достижения выше средне­го уровня. Первая группа составляет 33,3% выборки, вторая — 44,4 и третья — 22,2%.


Страница: