2.16. Test ve Madde İstatistiklerine Genel Bir Bakış

4.TEST VE MADDE İSTATİSTİKLERİNE GENEL BİR BAKIŞ
Doç. Dr. Güçlü ŞEKERCİOĞLU
4.1. TEST İSTATİSTİKLERİ:
Ölçme işlemi sonucunda bireylerin toplam puanları üzerinden hesaplanan istatistiklerdir. Eğitimde en sık kullanılan istatistikler merkezî eğilim ölçüleri, değişkenlik ölçüleri, dağılım özellikleri, standart puanlar vb.dir.
Merkezî eğilim ölçüleri: aritmetik ortalama, medyan (ortanca) ve moddur. Bu üç istatistiğin de temel işlevi bir puan dizisindeki merkezi bulmaktır. Merkezî eğilim ölçüsü hesaplamak ne işimize yarar? Ne tür kararlar almamızı sağlar? Merkezî eğilim ölçüleri, örneğin ortalama, grubun başarısı (ya da hangi özellik gözleniyorsa) hakkında kabaca da olsa fikir yürütmemizi sağlar. Söz gelimi ortalama 53 olursa grup başarı düzeyi açısından vasat, 82 olursa başarılı, 27 olursa başarı düşük vb. değerlendirmeler yapılabilir. Üstelik bazen bu ölçülerden herhangi biri ölçüt olarak kabul edilerek değerlendirme (bağıl) yapılabilir. Ancak bu istatistikler ile grup hakkında sınırlı değerlendirmeler yapılabilir.
Diğer taraftan değişkenlik ölçüleri ranj (dizi genişliği), varyans, standart sapma ve çeyrek sapmadır. Değişkenlik ölçüleri grubun kabaca homojen ya da heterojen bir özellik gösterip göstermediği, standart sapma örnek olarak verilirse değişkenliğin ortalama etrafında nasıl dağıldığını gösterir. Puanların değişkenliği, grup hakkında biraz daha ayrıntılı bir değerlendirme yapılmasını sağlar.
Puanların dağılım özellikleri yine grup hakkında bilgi elde etmemizi sağlayan istatistiklerdir. Bu istatistikler genellikle histogramlar ya da çizgi grafikleri ile gösterilse de grubun dağılımı hakkında değerlendirme yapmamıza olanak sağlayan pek çok istatistik bulunmaktadır.

Şekil 17: Normal, sivri ve basık dağılımlar

Şekil 18: Sola ve sağa çarpık dağılımlar
Evrende pek çok fiziksel, fizyolojik ya da psikolojik özelliğin normal dağılım eğrisine göre dağıldığı, diğer bir ifadeyle bu dağılımın “normalin bir ölçüsü” olduğu kabulü yapılır. Sivri, basık, sola çarpık ve sağa çarpık dağılımlar normalden sapma gösteren dağılımlardır. Normalden sapma durumlarının pek çok nedeni olabilir. Örneğin grup sayısının az olması, testin kolay ya da zor olması, grubun ölçülen özellik açısından genel niteliği vb. durumlar.
Normal dağılım ortalama ve standart sapma gibi basit iki istatistikle özetlenebilir.
Normal dağılım ortalama etrafında üç standart sapma sağa ve sola, toplamda altı alanda özetlenebilir (%99,74’lük kısmı). Dolayısıyla bir kişinin ortalamadan kaç standart sapma uzaklaştığı, grup içerisindeki yerini gösterir.

Şekil 19: Standart normal dağılım altında yer alan alanlar
4.2. MADDE İSTATİSTİKLERİ:
Ölçme işlemi sonucunda bireylerin madde puanları üzerinden hesaplanan istatistiklerdir. Eğitimde en sık kullanılan istatistikler madde güçlük indeksi, madde ayırt edicilik indeksi, madde güvenilirliği vb.dir.
Madde güçlük indeksi; maddenin kabaca zor mu, orta mı, kolay mı olduğunu gösteren bir istatistiktir.

Şekil 20: Madde güçlük indeksi
Madde güçlük indeksi 1’e yaklaştıkça maddenin kolaylaştığı, 0’a yaklaştıkça zorlaştığı anlaşılır. 0.50 civarı ise ortalama güçlükte olduğu biçiminde yorumlanır. Her ne kadar ayrı bir formülü olsa da madde güçlükleri toplamının madde sayısına bölümü testin ortalama güçlüğünü ortaya koyar. Bu noktada öğretmenlerin zihninde şu sorular olabilir: “Hazırbulunuşluluğu ölçmeyi ya da öğrenme eksiklerini tespit etmeyi ya da not vermeyi amaçlayan bir öğretmen testinin / sınavının ortalama güçlüğünü ne düzeyde tutmalıdır? Soruların güçlük dağılımı nasıl olmalıdır?” Bu tür amaçlarla hazırlanan sınavlarda kolay ve zor sorular teste konulabilir ancak ortalama güçlükteki sorular her zaman sayıca daha fazla olmalıdır. Nihayetinde testin ortalama güçlüğü hesaplandığında 0.50 olması ideal durumdur. Pekâlâ “test zor ya da kolay olursa ne olur?” Bir test zorlaştıkça dağılımın sağa çarpık, kolaylaştıkça sola çarpık olma olasılığı artar.
Diğer bir ifadeyle grup başarı düzeyi açısından homojenleşmeye başlar ve homojen bir dağılımda testin bilenle bilmeyeni birbirinden ayırt etme gücü azalabilir ve güvenilirlik katsayısı düşebilir. Diğer bir ifadeyle ayırt ediciliği ve güvenilirlik katsayısı yüksek bir ölçme işlemi için öğretmen zor ve kolay sınavlardan ziyade orta güçlükte bir test hazırlamalıdır (Daha önce de açıklandığı gibi elbette testte kolay ve zor sorular olabilir.).
Madde ayırt edicilik indeksi ise maddenin bilenle bilmeyeni ayırt edip edemediğine ilişkin bir istatistiktir. -1 ile 1 arasında değer alır ve genellikle alanyazında 0.30 ile 1 arası ayırt edici olarak nitelendirilir.

Şekil 21: Madde ayırt edicilik indeksi
2.1. Ölçme Ve Değerlendirmenin Temel Kavramları – I
2.2. Ölçme Ve Değerlendirmenin Temel Kavramları – II
2.3. Ölçme Ve Değerlendirmenin Temel Kavramları – III
2.4. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – I
2.5. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – II
2.6. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – III
2.7. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – IV (25dk 40sn)
2.8. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – V (21dk 38sn)
2.9. Test Geliştirme ve Madde / Soru Türleri – I
2.10. Test Geliştirme ve Madde / Soru Türleri – II
2.11. Test Geliştirme ve Madde / Soru Türleri – III
2.12. Test Geliştirme ve Madde / Soru Türleri – IV
2.13. Test Geliştirme ve Madde / Soru Türleri – V
2.14. Test Geliştirme ve Madde / Soru Türleri – VI
2.15. Test Geliştirme ve Madde / Soru Türleri – VII
2.16. Test ve Madde İstatistiklerine Genel Bir Bakış
2.17. Uluslararası Eğitim İzleme Araştırmaları
2.18. PISA: Kapsamı ve Sonuçları
2.19. TIMMS: Kapsamı ve Sonuçları
2.20. OECD: Sosyal Duygusal Beceriler İzleme Araştırması