2.6. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – III (Geçerlilik Sorgulama Yöntemleri)

2.4. GEÇERLİLİK SORGULAMA YÖNTEMLERİ:
Geçerlilik sorgulama yöntemleri aşağıda Şekil 4’te gösterilmiştir.

Şekil 4: Geçerlilik yöntemleri sınıflaması
2.4.1. KAPSAM GEÇERLİLİĞİ:
Kapsam geçerliliği özellikle başarı testlerinde aranan bir geçerlilik sorgulamasıdır. Eğitimde öğretmen bir program dâhilinde önceden belirlenen davranışları kazandırmayı amaçlar. Belirli bir zaman sonra davranışların ne kadarının kazanıldığını belirlemek isteyen öğretmen, geliştirdiği testte öğretime konu olan içeriğin testte ne ölçüde temsil edildiğini belirlemek durumundadır. Bu anlamda kapsam geçerliliği bir testin ölçülmek istenen davranışları ne derece kapsadığıyla ilgilidir. Ne amaçla kullanılırsa kullanılsın
test, kapsamı açısından ölçmeye konu olan davranışları yeterli ve dengeli bir biçimde temsil etmelidir. Bir testin kapsam geçerliliğinin yüksek olduğunun söylenebilmesi için
1- Testteki soruların / maddelerin ölçülecek özellikler evrenini (konu kapsamını / içeriği) yeterli ve dengeli bir biçimde ölçüyor olması ve
2- Her bir sorunun / maddenin ölçmek istediği özelliği doğrudan ölçmesi, diğer bir deyişle kazanımla doğrudan ilgili olması gerekir.
Testin kapsam geçerliliğinin yüksek olduğunun söylenebilmesi için bu iki kriter birden sağlanmalıdır.
Kapsam geçerliliği sorgulama yöntemleri:
2.4.1.1. Mantıksal / rasyonel yöntemler:
Bu yöntemler belirtke tablosu hazırlanması ve uzman görüşüne başvurulmasıdır.
Belirtke tablosunun hazırlanması:
Bir kapsam geçerliliği sorgulamasında öncelikle ölçmeye konu olan kapsam dâhilinde davranışların belirlenmesi gerekir. Bu noktada en çok kullanılan yöntemlerden biri belirtke tablosu hazırlamaktır. Öğretmen satırda davranışları, sütunda hedefleri yazar; belirlediği madde sayısı doğrultusunda davranış ve hedefleri yeterli ve dengeli bir biçimde temsil eden alanları seçer.
Tablo 3. Belirtke tablosu örneği

Uzman görüşüne başvurulması:
Uygulamada uzman ile kastedilen öncelikle ölçme ve değerlendirme tekniklerini de bilen bir alan uzmanıdır. Uzmana belirtke tablosu ve maddeler sunulur, uzmandan soruların / maddelerin konu kapsamını yeterli ve dengeli bir biçimde ölçme durumunu ve soruların / maddelerin kazanımlarla doğrudan ilgili olma durumunu değerlendirmesi istenir.
2.4.1.2. İstatistiksel yöntemler:
Uzmanlardan alınan dönütler betimsel / muhakemeye dayalı bir yolla çözümlenebilir ya da uzmanların “uygundur / uygun değildir” ya da “uygundur / düzeltme gerekir / soru kullanılmamalıdır” vb. biçimde değerlendirme yapması istenebilir. Eğer uzmandan ikinci yolla dönüt istenmişse uzmanlar arasında uyuşum olup olmadığı, çeşitli istatistiksel yöntemlerle test edilir. Alanda uzmanlar arasında uyumu test eden pek çok indeks bulunmaktadır.
2.4.2. ÖLÇÜT DAYANAKLI GEÇERLİLİK:
Ölçme aracından elde edilen puanların ölçüt bir puanla (testin tahmin etmeye çalıştığı ve geçerliliği yüksek bir puan) karşılaştırılarak geliştirilen ölçme aracının geçerliliğine ilişkin nitelendirme yapılır.
2.4.2.1. YORDAMA GEÇERLİLİĞİ:
Yordama, tahmin demektir ancak her tahmin yordama değildir. Bir tahminin yordama olabilmesi için elde geçerli ve güvenilir bir veri olması ve bu verinin sınanabilir, sayısal nitelikte, belirli analizlere tabi tutuluyor olması gerekiyor. Diğer bir deyişle yordama, eldeki bu nitelikteki veriden yola çıkarak geleceğe, henüz gerçekleşmemiş bir olguya ilişkin yapılan tahmindir.
Ölçme araçlarının çoğunda bireylerin gelecekteki davranışlarının kestirilmesi söz konusudur. Yordama geçerliliği, ölçme aracının bu kestirim işini ne ölçüde doğru ve isabetli yaptığı ile ilgili bir sorgulamadır. Özellikle iki amaçla uygulanan ölçme araçlarının yordama geçerliliğinin yüksek olması istenir. Bunlar seçme ya da yönlendirme amaçlı kullanılan testlerdir.
Seçme amaçlı testlere YKS, KPSS, LGS vb. araçlar; diğer taraftan yönlendirme amaçlı testlere ise alan seçiminde ve/veya bir üst öğretim kurumuna yönlendirmek için uygulanan yetenek testleri, ilgi envanterleri, mesleki kişilik envanterleri vb. örnek olarak gösterilebilir.
Yordama geçerliliğinde ölçme aracından elde edilen puanlar, ölçme aracının tahmin ettiği puanla (ölçüt puan) karşılaştırılır ve tahminin ne ölçüde doğru olduğu belirlenmeye çalışılır.
Ölçüt puan testin tahmin etmeye çalıştığı özelliktir. Yordama geçerliliğinde ölçüt puan gelecekte belli olacağından beklemek gerekmektedir. Yordama geçerliliğinde geçerlilik katsayısının 0 ile 1 arasında değişmesi beklenir.

Şekil 5: Bir yordama geçerliliği çalışma örneği
Yordama geçerliliğinde en zor ve önemli nokta ölçütün doğru bir biçimde belirlenmesidir. Ölçütün belirlenmesinde şu noktalar dikkate alınmalıdır: Ölçüt(ün);
1- Ölçme aracının yordamaya çalıştığı değişkenle doğrudan ilgili olmalı, ölçme aracı hangi
özelliği kestirmeyi amaçlıyorsa onun doğrudan bir temsili olmalıdır.
2- Kararlı olmalı, günden güne değişmemelidir. Açıktır ki kendisi kararsız olan bir özellik
hiçbir araçla yordanamaz.
3- Bireylerin özelliğini gerçekten yansıtan nesnel ve güvenilir bir ölçüt olmalıdır. Söz gelimi
okulda alınan notlar bir ölçüt olarak alınmışsa öğrencilere verilen notlara başarının dışındaki etmenler etki etmemelidir.
4- Elde edilmesi kolay ve ekonomik olmalıdır.
2.4.2.2. ZAMANDAŞ GEÇERLİLİK:
Bu geçerlilik türü alanyazında hâlihazır geçerlilik, benzer ölçekler geçerliliği, uygunluk geçerliliği adı ile de anılmaktadır.
Zamandaş geçerlilik sorgulamalarında ölçüt puan eş zamanlı olarak elde edilebilir.
Geliştirilen ölçme aracı ile ilişkili olabilecek nitelikleri ölçen ve geçerliliği yüksek bir aracın puanı ölçüt puan olarak ele alınabilir. Daha sonra geliştirilen ölçme aracı ve ölçüt araç aynı zamanda uygulanıp iki araçtan elde edilen puanlar arasındaki ilişki incelenir.

Şekil 6: Bir zamandaş geçerlilik çalışma örneği
Zamandaş geçerliliğinde geçerlilik katsayısının –1 ile 1 arasında değişmesi beklenir. Ölçüte bağlı olarak geçerlilik katsayısı ∓1’e yaklaştıkça artar, 0’a yaklaştıkça düşer.

Şekil 7: Geçerlilik katsayısı
Zamandaş geçerlilikte de en zor ve önemli nokta ölçütün doğru bir biçimde belirlenmesidir. Ölçütün belirlenmesinde şu noktalar dikkate alınmalıdır: Ölçüt(ün);
1- Ölçme aracının ölçmeye yöneldiği özellikle doğrudan ilişkili olmalıdır. Bu ilişki doğru
orantılı ya da ters orantılı olabilir.
2- Geçerliliği yüksek olmalıdır. Geçerliliği yüksek olmayan bir ölçüt puanla bakılacak
korelasyonun düşük olması kaçınılmazdır.
2.1. Ölçme Ve Değerlendirmenin Temel Kavramları – I
2.2. Ölçme Ve Değerlendirmenin Temel Kavramları – II
2.3. Ölçme Ve Değerlendirmenin Temel Kavramları – III
2.4. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – I
2.5. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – II
2.6. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – III
2.7. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – IV (25dk 40sn)
2.8. Bir Ölçme Aracında Bulunması Gereken Psikometrik Nitelikler – V (21dk 38sn)
2.9. Test Geliştirme ve Madde / Soru Türleri – I
2.10. Test Geliştirme ve Madde / Soru Türleri – II
2.11. Test Geliştirme ve Madde / Soru Türleri – III
2.12. Test Geliştirme ve Madde / Soru Türleri – IV
2.13. Test Geliştirme ve Madde / Soru Türleri – V
2.14. Test Geliştirme ve Madde / Soru Türleri – VI
2.15. Test Geliştirme ve Madde / Soru Türleri – VII
2.16. Test ve Madde İstatistiklerine Genel Bir Bakış
2.17. Uluslararası Eğitim İzleme Araştırmaları
2.18. PISA: Kapsamı ve Sonuçları
2.19. TIMMS: Kapsamı ve Sonuçları
2.20. OECD: Sosyal Duygusal Beceriler İzleme Araştırması