Dikey Ölçeklemede Klasik Test ve Madde Tepki Kuramına Dayalı Yöntemlerin Karşılaştırılması


Comparison of the Methods of Classical Test Theory and Item Response Theory on Vertical Scaling


Yrd. Doç. Dr. Emre ÇETİN & Prof. Dr. Selahattin GELBAL


ÖZET
Dikey ölçekleme, öğrencilerin, ardışık sınıf ya da yaş seviyelerinde matematik ya da okuma becerileri gibi alanlarda, ne kadar gelişim ortaya koyduğunu belirlemeye yarayan bir test bağlama türüdür. Bu araştırmanın amacı, dikey ölçekleme işlemi sonucunda, sınıf seviyesi arttıkça, bu seviyelerde meydana gelen gelişimin örüntüsünü çıkarmaktır. Araştırmanın verilerini, 2005 yılında Türkiye genelinde yapılan İlköğretim Öğrencilerinin Başarılarının Belirlenmesi Sınavı’na (ÖBBS) ait 6., 7. ve 8. sınıf öğrencileri oluşturmaktadır. Dikey ölçekleme, Klasik Test Kuramı (KTK) ve Madde Yanıt Kuramı (MTK) temelinde uygulanmıştır. KTK’ya dayalı olarak Thurstone (1938), Madde yanıt Kuramına dayalı olarak yapılan yetenek kestirimlerinde de Expected A Posteriori (EAP) puanlama yolu kullanılmıştır. Dikey Ölçekleme sonuçlarının değerlendirme ölçütü olarak; ortalama, standart sapma ve etki büyüklüğü değerleri kullanılmıştır. Araştırma sonunda, Thurstone ölçeklemede Matematik ve Türkçe testlerinde sınıf seviyesi ile birlikte standart sapmalar artış göstermektedir. Araştırmaya dayalı bulgular incelendiğinde, gerek KTK gerekse MTK uygulamalarında, ortalamaların seyrinden farklı olarak standart sapmaların arttığı söylenebilir.


ABSTRACT
Vertical Scaling is a kind of linking which is used to determine how much the students of adjacent grades or ages have improved in the subject areas such as Maths and Language. The purpose of this research is, as a result of vertical scaling, to establish the pattern of students’ improvement in certain levels as class grade increases. The data in this research were obtained from the Achievement Exam (OBBS) results for Turkish primary school students of the 6th, 7th and 8th grades in 2005. Vertical Scaling was conducted based on Classic Test Theory (CTT) and Item Response Theory (IRT). Thurstone (1938) scaling method was used based on CTT, and Expected A Posteriori (EAP) scaling method was used in IRT estimation. As an evaluation criteria of vertical scaling, mean, standard deviation and effect size figures in academic growth were used. At the end of the research, in Thurstone Scaling, standard deviations in Maths and Turkish Tests rise as class levels increase. In the conducts of CTT and IRT, it can be said that standard deviations increase free from the increase or decrease of means.


ANAHTAR KELİMELER: Dikey ölçekleme, test eşitleme, bağlama, örneklem büyüklüğü, akademik gelişim


KEYWORDS: Vertical scaling, test equating, linking, sample size, academic growth

[PDF]

efdergi@hacettepe.edu.tr        http://www.efdergi.hacettepe.edu.tr           Hacettepe University, Faculty of Education 06800 Beytepe / Ankara

 Facebok Page of Hacettepe University Journal of Education              Twitter of Hacettepe University Journal of Education