Анализ тестовых материаловРефераты >> Математика >> Анализ тестовых материалов
Анализ значений коэффициента корреляции позволяет выделить 3,4,5 задания. По данным таблицы, третье задание отрицательно коррелирует с 4, 6, 8 заданиями теста. О том, что «виновато третье», а не другие задания теста, свидетельствует анализ значений коэффициента корреляции в столбцах с номерами 4, 6 и 8. В них просматривается только один минус на месте, соответствующем третьему заданию теста, которое, в свою очередь, отрицательно коррелирует с тремя заданиями теста. Аналогичная ситуация наблюдается в столбце, соответствующем 4, 5 заданиям теста.
Отрицательные значения коэффициента корреляции указывают на определенный просчёт разработчиков в содержании этих заданий теста.
Скорее всего, отрицательные значения коэффициента корреляции указывают на отсутствие связи их содержания с содержанием других заданий теста.
В программе работа по запуску этого метода не отличается от предыдущих. Единственным отличием является то, что на форме не выводится загружаемая матрица результатов. Это сделать для того, чтобы не перегружать форму, ведь для нас важен результат, а не содержимое.
В итоговых тестах высокой корреляции стараются избежать, поскольку вряд ли имеет смысл: включать в итоговый тест несколько заданий, содержащих одинаковые содержательные элементы. В тестах такого типа значения коэффициента корреляции варьируются в интервале (0; 0,3) и каждое задание привносит свой специфический вклад в общее содержание теста.
В результате проведенного исследования можно сделать выводы, что в используемом варианте теста несколько заданий, в частности 3 и 5 не соответствуют по качеству для проверки уровня знаний и их следует пересмотреть.
Но основной вывод по работе заключается в следующем факте: проводя исследовательские расчеты классическими методами и одним из методов IRT, были получены слегка разрозненные результаты. Так, например, метод Раша выявил 8 задание как слишком сложное для данных групп испытуемых. Классические методы этого факта не заметили. Можно заключить, что используемые методы хорошо использовать не по отдельности, а в совокупности. Это позволит сделать более объективную оценку.
Заключение.
Таким образом, при выполнении дипломной работы была изучена предметная область, связанная с проблемой оценки качества тестовых материалов. Ведь понятие качества включает в себя оценку надежности и валидности тестовых материалов, являющихся одними из важнейших характеристик педагогических измерений.
Были рассмотрены классические методы и методы IRT, на основе экспериментальных данных был проведен сравнительный анализ результативности методов и тестовых заданий. В частности, применялись методы расчета точечно–бисериального коэффициента корреляции, корреляции Пирсона и рассмотрена однопараметрическая модель Раша.
На основе изученных методов была создана программа, позволяющая на основе введенных данных произвести расчет показателей качества теста. В ней были использованы вышеперечисленные методы.
На данный момент программный продукт находится на этапе тестирования и отладки.
Список литературы:
1. Алексеенко А. С.Математическая обработка результатов тестовых проверок в соответствии с классической теорией тестов.// Тезисы доклада семинара «методология и концепция компьютерного тестирования», - Москва, 2003.
2.Аванесов В.С. "Композиция тестовых заданий".- М., 1998, С. 156-207.
3. Аванесов В.С. Основы научной организации педагогического контроля в высшей школе, Учебное пособие.- М.: Исследовательский центр, 1989, - 167 с.
4. Березин Н.В. Выбор дистракторов в заданиях в закрытой форме. Анализ и моделирование в рамках IRT. // Тезисы докладов Всероссийской научно-методической конференции «Развитие системы тестирования в России», - Москва, 2002, С. 229-230.
5. Власова Е.А. Модель оценивания результатов тестирования по дробной шкале. // Тезисы докладов Всероссийской научно-методической конференции «Развитие системы тестирования в России». - Москва, 2002, С. 231-232.
6. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 1997. - 480 с.
7. Елисеев И.Н., Елисеев И.И., Гладилин А.Н. Программный модуль ANALIZATOR для расчета параметров тестовых заданий с несколькими верными ответами. // Тезисы докладов Всероссийской научно-методической конференции «Развитие системы тестирования в России». - Москва, 2002, C. 293-234.
8. Кромер В.В. Единое шкалирование разновариантных тестов. // Тезисы докладов Всероссийской научно-методической конференции «Развитие системы тестирования в России». - Москва, 2002, C. 239-240
9. Люсин Д.В. Основы разработки и применения критериально-ориентированных педагогических тестов.- М.: Исследовательский центр, 1993, - 51 с.
10. Нейман Ю.М. О шкалировании результатов централизованного тестирования в 2001 году. // Вопросы тестирования в образовании, № 1, 2001, С. 94-106.
11.Овчинников В.В. Анализ внутренней валидности тестовых заданий аттестационного тестирования 2002 года. // Тезисы докладов Всероссийской научно-методической конференции «Развитие системы тестирования в России». - Москва, 2002, С. 243-244.
12.Овчинников В.В. Оценивание учебных достижений учащихся при проведении централизованного тестирования. – М.: Из-во Век книги, 2001. - 27 c.
13. Переверзев В.Ю. Критериально - ориентированные педагогические тесты для итоговой аттестации студентов. - М.: Из-во НМЦ СПО Минобразования РФ, 1998. - 152 с.
14. Переверзев В.Ю. Зарубежный опыт массового педагогического тестирования абитуриентов. // Тезисы докладов шестого симпозиума “Квалиметрия человека и образования: методология и практика”, Книга II, Ч.2, -Москва, 1997. - 167 с.
15. Смирнов С.Д. Педагогика и психология высшего образования: От деятельности к личности. Учебное пособие. – М.: Высшая школа, 1995. - 271с.
16. Челышкова М.Б. Теория и практика конструирования педагогических тестов. Учебное пособие. – М.: Логос, 2002. - 432 с.
17. Янченко С.И. Математическая модель оценки результатов тестирования. // Тезисы докладов Всероссийской конференции «Развитие системы тестирования в России». - Москва, 2000, ч. 4, С. 54-56.
18. Rasch G. Probabilistic Models for Some Intelligence and Attainment Tests. Copenhagen, Denmark: Danish Institute for Educational Research, 1978.
Приложение 1. Данные по результатам тестирования.
Группа 323.
№ вопроса | |||||||||
№ студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 | |
1 |
1 |
0 |
1 |
1 |
1 |
0 |
1 |
0 | |
2 |
1 |
1 |
0 |
1 |
1 |
1 |
0 |
1 | |
3 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
1 | |
4 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 | |
5 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
1 | |
6 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 | |
7 |
1 |
1 |
0 |
1 |
0 |
0 |
1 |
0 | |
8 |
0 |
1 |
0 |
1 |
0 |
0 |
1 |
0 | |
9 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 | |
10 |
1 |
1 |
0 |
1 |
1 |
1 |
0 |
1 | |
11 |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
0 | |
12 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
1 | |
13 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
1 | |
14 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 | |
15 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
0 | |
16 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
0 | |
17 |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
1 | |
18 |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
0 |