Validitas
merupakan suatu ukuran yang menunjukkan kevalidan atau kesahihan suatu
instrument. Suatu tes atau instrument memiliki validitas apabila tes/instrument
tersebut mengukur apa yang seharusnya diukur. Sebagai
contoh, sebuah tes untuk pelamar pekerjaan akan valid apabila tes itu mengukur
kemampuan terkait kinerja di pekerjaan tersebut kelak (Allen & Yen, 1979:
95).
Pengertian
serupa dirangkum Mardapi (2017: 32) dari Standard, 1999 yaitu validitas atau kesahihan
menunjuk pada dukungan atau derajat bukti dan teori mendukungg penafsiran score
tes sebagai tujuan penggunaan tes. Beliau
mencontohkan apabila suatu tes matematika, maka penafsiran tes tersebut harus
berdasarkan teori yang digunakan yaitu definisi tentang kemampuan matematika. Hal
ini mengakibatkan validitas merupakan fundamen paling dasar dalam
mengembangkan dan mengevaluasi suatu
tes. Proses validasi akan mencakup pengumpulan bukti-bukti untuk menunjukan
dasar keilmiahan penafsiran skor seperti yang direncanakan. Validitas adalah
penafsiran skor tes seperti yang tercantum pada tujuan penggunaan tes, bukan
tes itu sendiri. Apabila skor tes ditafsirkan lebih dari satu makna, setiap
penafsiran atau pemaknaan harus divalidasi (Standard, 1999).
Validitas
dapat dinilai melalui beberapa cara tergantung pada tes dan tujuan
penggunaannya. Berikut cara penilaian validitas menurut beberapa ahli.
1. Allen
& Yen (1979: 95-114)
Allen
& Yen (1979: 95-114) menyampaikan tiga jenis validitas yang utama, yaitu: content
validity (validitas isi), criterion-related validity, dan construct
validity.
a.
Content validity
Content
validity dikembangkan melalui sebuah Analisa rasional tentang
isi tes dan penentuannya berdasarkan penilaian subjektif
individu. Ada dua jenis utama validitas isi, yakni face validity dan
logical validity. Validitas muka terkadang disebut dengan validitas
“armchair”. Validitas ini dikembangkan ketika seseorang memeriksa sebuah tes
dan memutuskan bahwa tes ini menilai hal/ sifat yang relevan. Yang bisa
melakukan penilaian ini bisa siapapun dari ahli sampai orang yang mengikuti tes
tersebut. Jika orang-orang tidak setuju, validitas muka tersebut dipertanyakan.
Validitas muka bisa jadi cukup untuk menilai suatu tes misalnya tes atau ujian
di kelas. Contohnya, tes aritmatika, dalam validitas mukanya mengukur kemampuan
aritmatika.
1)
Validitas muka/ face validity
Validitas
muka/ face validity bisa menjadi penting untuk beberapa hal sebafai
contoh suatu tes seleksi pekerjaan. Apabila tes itu tidak mengukur keterampilan
calon pekerja dalam pekerjaannya kelak, maka hal ini akan menjadi hal yang
kurang baik untuk divisi Humas di perusahaan tersebut apabila validitas muka
tidak terpenuhi. Validitas muka bisa menjadi penting untuk penerapan tes-tes
tertentu, namun, bisa jadi tidak terlalu penting di tes lainnya ketika
validitas lainnya telah terpenuhi.
2)
Validitas logis/ logical validity
Selanjutnya
validitas isi yang kedua adalah logical atau sampling validity. Validitas
ini lebih komplek dari validitas muka. Validitas ini melibatkan pengertian dan
domain sikap yang akan diukur serta desain logis untuk mencakup seluruh area
penting dalam domain tersebut. Validitas logis biasanya sangat bermanfaat dalam
tes prestasi.
Karena
validitas isi didasarkan pada penilaian subjektif, penentuan nilai validitas
ini lebih rentan terhadap kesalahan/error dibandingkan validitas lainnya. Akan
tetapi, memenuhi validitas isi menjadi pertimbangan utama dalam pengembangan
suatu tes dan butir-butir soal dikembangkan untuk memenuhi validitas isi.
Melalui sebuah Teknik analisis butir, tes bisa ditingkatkan dan dikembangkan
untuk jaminan bahwa aspek lain penilaian telah terpenuhi. Akan tetapi biasanya
pemenuhan validitas isi saja tidaklah cukup, validitas lain perlu dipenuhi.
Salah satu validitas tersebut adalah validitas terkait kriteria atau criterion-related
validity.
b.
criterion-related
validity.
Validitas
terkait kriteria digunakan ketika skor tes bisa dihubungkan dengan kriteria.
Kriteria tersebut adalah beberapa sikap yang diprediksi melalui tes. Sebagai
contoh, untuk memperoleh validitas kriteria ini, skor sebuah tes penyaringan
pekerja harus disesuaian dengan kriteria keefektifan pekerjaan. Atau untuk
memperoleh validitas kriteria, skor dalam penerimaan siswa baru harus
dihubungkan dengan kriteria tertentu misalnya IPK dari siswa/mahasiswa dan
presentasi siswa yang bisa menyelesaikan program tersebut.
Validitas
kriteria biasanya disampaikan dalam sebuah koofesisian hubungan yaitu hubungan
antara skor tes (predictor) dengan skor kriteria. Korelasi ini disimbolkan
dengan ρxy, di mana X adalah skor
tes (predictor) dan Y adalah skor kriteria.
Koefisien validitas. ρxy dihitung melalui satu
atau dua cara yaitu perhitungan validitas prediktif (predictive validity)
dan perhitungan validitas bersamaan (concurrent validity).
1)
validitas prediktif (predictive
validity)
Validitas
prediktif ini melibatkan penggunaan skor tes untuk memprediksi sikap di masa
yang akan dating. Koefisien validitas prediktif didapatkan dengan memberikan
tes ke beberapa orang yang relevan/ tepat kemudian menunggu beberapa kurun waktu untuk mengumpulkan skor
kriteria dan menghitung koefisien validitasnya. Sebagai contoh, validitas
prediktif dalam tes penyaringan pegawai digunakan untuk mengetas semua calon,
lalu mempekerjakan seluruh pelamar, dan kemudian menunggu beberapa minggu atau
bulan sampai akhirnya kriteria dapat dihitung secara reliabel misalnya melalui
rating atasan atau penilaian kinerja. Prosedur ini akan memberikan informasi
seberapa bagus skor tes dalam memprediksi sikap di masa yang akan datang.
Kelemahannya, tes ini memakan banyak waktu dan biaya. Jika pemberi pekerjaan
tidak ingin mempekerjakan semua pelamar, maka akan ada batasan baik dalam
predictor maupun kriteria. Ketika suatu tes digunakan untuk mengukur atau
memperkirakan sikap di masa yang akan datang maka validitas prediktif
digunakan.
2)
validitas bersamaan (concurrent
validity).
Namun
selain validitas prediktif, sebuah alternative untuk mengukur hal serupa adalah
penggunaan koefisien validitas bersamaan atau concurrent validity
coefficient. Validitas ini adalah hubungannya tes dengan kriteria yang
keduanya diukur dalam waktu bersamaan. Sebagai contoh, penghitungan skor
predictor dan kriteria dalam suatu pekerjaan dalam waktu bersamaan. Kelemahan
Teknik ini adalah keterbatasan ruang karena pekerja yang menunjukkan performa
kurang baik pasi dipecat dan pelamar yang skor tesnya tidak memenuhi syarat
tidak akan diterima. Concurrent validity coefficient tepat digunakan
ketika skor tes digunakan untuk menilai kinerja saat ini dan bukan memprediksi
kriteria di masa yang akan datang.
c.
Validitas konstruk/construct validity
Validitas
jenis ketiga adalah validitas konstruk/construct validity. Validitas
konstruk adalah derajat di mana tes ini mengukur konstruk teoretis dan sikap
yang seharusnya diukur. Mengembangkan validitas kosntruk adalah sebuah proses
terus menerus. Berdasarkan teori terkait
trait/sifat yang akan diukur, seorang pengembang tes memprediksi bagaimana tes
harus ber[erilaku dalam berbagai
situasi.
Prediksi
ini kemudian diuji. Jika prediksi didukung oleh data, validitas konstruk meningkat.
Jika prediksi tidak didukung oleh data, setidaknya ada tiga kesimpulan
alternatif itu dapat ditarik: (1) percobaan itu cacat, (2) teorinya salah dan harus
direvisi, atau (3) tes tidak mengukur sifat. Meskipun membangun membangun
validitas adalah proses tanpa akhir, pengembang tes dapat menunjukkan membangun
validitas untuk ujian dalam situasi tertentu.
Setiap
prediksi yang dapat diuji dapat dibuat untuk mendukung validitas konstruk,
termasuk prediksi validitas konten dan terkait kriteria. Prediksi lain yang
mungkin termasuk:
1.
Perbedaan kelompok. Jika teori ini menyiratkan perbedaan kelompok (atau tidak
ada perbedaan kelompok) dalam skor tes, prediksi ini dapat dipelajari dengan
mengumpulkan data dan melakukan uji statistik hipotesis yang masuk akal.
Sebagai contoh, satu mungkin memprediksi perbedaan antara anak-anak dan orang
dewasa pada tes kematangan sosial, atau orang mungkin memprediksi tidak ada
perbedaan di antara kelompok-kelompok budaya pada "culturefair" tes
kemampuan.
2.
Perubahan. Teori ini dapat menyiratkan bahwa skor tes berubah seiring waktu
atau setelahnya intervensi eksperimen. Misalnya, tes yang mengukur komunikasi
lisan keterampilan harus menghasilkan skor yang lebih tinggi ketika anak-anak
tumbuh dewasa atau ketika anak-anak mengikuti kelas yang relevan di sekolah.
Teori ini juga dapat memprediksi perubahan dalam beberapa skor tapi tidak untuk
hal-hal yang lain. Misalnya, pengalaman pelatihan ketegasan harus mampu
meningkatkan skor “ketegasan” tetapi tidak mempengaruhi skor kosa kata/ vocabulary.
3.
Korelasi. Teori ini mungkin mengarahkan pengembang pengujian untuk memprediksi
satu atau lebih itu korelasi apakah positif, negatif, atau nol. Sebagai contoh,
kita mungkin mengharapkan skor pada tes memori jangka pendek untuk berkorelasi
positif dengan usia dan tidak berkorelasidengan seks. Prediksi dapat melibatkan
kumpulan korelasi.
4.
Proses. Misalkan tes penalaran matematis berisi masalah kata itu menggunakan
kata-kata yang sangat sulit. Berdasarkan satu teori kita dapat memprediksi
semua peserta ujian sedang memproses atau memikirkan soal-soal ujian dengan
cara yang sama. Namun, teori lain mungkin menuntun kita untuk berharap bahwa
beberapa peserta ujian mungkin bisa untuk melakukan matematika tetapi tidak dapat memulai
masalah karena kosa kata mereka lemah. Dalam contoh ini tes mengukur penalaran matematis
untuk beberapa orang
tingkat ujian dan
kosakata untuk peserta ujian lainnya. Pemeriksaan barang konten dan korelasi antara skor
item atau analisis wawancara dengan peserta ujian saat mereka menyelesaikan soal-soal ujian
dapat membantu kita memilih di antara teori tentang proses kognitif yang mendasari
solusi untuk item tes. Mungkin juga begitu masuk akal untuk memprediksi
bahwa proses yang berbeda terjadi di antara individu atau kelompok yang berbeda.
Misalnya, ada perbedaan jenis kelamin pada sebagian besar tes penalaran spasial. Seorang
peneliti dapat memperkirakan bahwa kedua jenis kelamin akan diproses item tes spasial dengan cara
yang berbeda dan kemudian menguji prediksi ini.
Beberapa aspek yang ada dalam konstruk
validitas akan dijabarkan dalam penjelasan berikut ini.
1) Validitas Multitrait-Multi metode
Validitas multitrait-multi metode adalah aspek
validitas konstruk yang dulu dikembangkan oleh Campbell dan Fiske (1959). Metode ini
digunakan saat dua atau lebih sifat-sifat diukur dengan dua metode atau lebih. Misalkan dua sifat introversi dan neurotisme diukur
dengan dua metode, soal true-false (T-F) dan soal pilihan ganda
(M-C). Keempat tes diberikan kepada sampel orang, dan matriks validitas
multitrait-multimethod yang dihasilkan muncul pada Tabel 5.9 ini. Matriks validitas itu mirip dengan matriks korelasi, yang merupakan
tampilan persegi panjang dari korelasi. Korelasi muncul di persimpangan setiap baris
dan kolom korelasi antara skor
pelabelan baris dan kolom itu. Misalnya, korelasi antara skor T-F neurotisme dan skor
T-F introversi adalah 0,20. Biasanya matriks korelasi memiliki 1.0s onits utama
diagonal (yang berjalan dari atas sudut kiri ke sudut kanan bawah matriks); yaitu korelasi
masing-masing variabel dengan dirinya sendiri, menurut
definisi, sama dengan 1.0. Metode multitrait-multimetode matriks validitas adalah matriks
korelasi dengan 1.0s digantikan oleh estimasi reliabilitas. Misalnya, perkiraan reliabilitas
skor T-F introversi adalah 80.
Pertimbangkan
properti yang harus dimililiki
oleh matriks multitrait-multimethod ini. Keandalan di diagonal utama harus besar. Korelasi antara dua ukuran yang berbeda
dari satu sifat juga harus tinggi. Korelasi antara ukuran sifat yang tidak
terkait harus rendah. Korelasi antara skor tes mengukur sifat yang berbeda
harus lebih kecil dari korelasi antara skor tes mengukur sifat yang sama. Tabel 5.9 merangkum hasil validitas multitrait-multi metode untuk sifat-sifat A
dan B diukur dengan metode 1 dan 2.
Dua tipe utama validitas
multitrait-multimethod diilustrasikan dalam Tabel 5.10: validitas konvergen dan
validitas diskriminan. Validitas konvergen ditunjukkan oleh korelasi tinggi antara skor
pada tes yang mengukur sifat yang sama dengan metode yang berbeda (misalnya,
rA1A2, rb b2). Korelasi tinggi ini menunjukkan bahwa tes menyatu pada sifat tersebut.
Validitas diskriminan ditunjukkan oleh korelasi yang rendah antara skor pada tes yang
mengukur sifat yang berbeda (misalnya, rAlBl, rA1B2, rA2Bl, RA2B2), terutama ketika
menggunakan metode yang sama (rAlBl, rA2B2) . Korelasi rendah ini menunjukkan bahwa tes membedakan antara berbagai sifat. Korelasi dalam Tabel 5.9 menunjukkan kedua validitas, baik validitas
multitrait-multimethod diskriminatif dan konvergen.
Ketika ada lebih
dari dua sifat atau metode, metode multitrait-multimetode matriks validitas lebih besar
dan sedikit lebih rumit. Namun, jenis yang sama pola harus terjadi untuk
menunjukkan validitas konvergen dan diskriminan. Pola korelasional itu harus memiliki nilai
tinggi untuk reliabilitas dan korelasi internal, nilai rendah untuk korelasi
lintas sifat, dan korelasi yang menunjukkan hal itu tidak ada bias karena metode.
Metode bias hadir jika korelasi antara skor untuk sifat yang berbeda lebih tinggi
ketika metode yang sama digunakan untuk mengukur keduanya sifat daripada ketika metode
yang berbeda digunakan untuk mengukur sifat. Misalnya, jika rAlBl dan rA2b2 jauh lebih besar daripada rA
lB2 dan rA2B1, bias metode disarankan karena korelasi yang lebih besar ketika
sifat-sifat tersebut diukur dengan metode yang sama. Namun jika rA1B1 hampir
sama dengan rA1B2, rA2B1, dan rA2B2, ada
bukti bahwa sifat-sifat diukur tanpa bias metode.
2) Validitas faktorial
Validitas
faktorial adalah suatu bentuk validitas konstruk yang ditetapkan melalui analisis
faktor. Analisis faktor adalah istilah yang mewakili sejumlah besar perbedaan prosedur matematis untuk
menganalisis keterkaitan di antara seperangkat variabel dan untuk
menjelaskan keterkaitan ini dalam jumlah variabel yang dikurangi, yang disebut
faktor. Suatu faktor adalah variabel hipotetis yang mempengaruhi skor pada satu
atau lebih variabel yang diamati. Sebagai contoh, lihatlah matriks korelasi pada
Tabel 5.11. Meskipun ada tiga skor tes yang berkorelasi, jelas bahwa hanya satu
faktor yang diukur, karena tingginya korelasi antar nilai ujian. Alih-alih
membutuhkan tiga skor untuk setiap orang, satu skor saja cukup.
Pertimbangkan
korelasi pada Tabel 5.12. Dua faktor sedang diukur oleh empat tes; tes 1 dan 2
mengukur satu faktor, dan tes 3 dan 4 mengukur faktor yang lain. Kedua faktor
tersebut tidak berkorelasi, karena dua pasang tes tidak berkorelasi, seperti
yang ditunjukkan oleh nol dalam matriks.
Sekarang
perhatikan korelasi pada Tabel 5.13. Sekali lagi, dua faktor sedang diukur; tes
1 dan 2 mengukur satu faktor, dan tes 3 dan 4 mengukur yang lain faktor. Namun,
kali ini kedua faktor tersebut tampaknya sedikit berkorelasi, seperti ditunjukkan
oleh korelasi rendah (.10, .20, dan .30) dalam matriks.
Contoh-contoh
sebelumnya melibatkan metode analisis faktor "bola mata". Dari
pemeriksaan visual hanya dari matriks, jelas berapa banyak factor yang ada.
Namun, ketika ada banyak variabel dalam matriks korelasi dan hubungan timbal
balik di antara mereka sangat kompleks, tidak begitu mudah untuk ditentukan berapa
banyak faktor yang ada, dan bahkan para ahli mungkin tidak setuju pada jumlah factor
dan hubungan timbal balik mereka. Namun, logika yang mendasari contoh sederhana
kami tetap sama untuk kasus kompleks.
Analisis
faktor seperangkat skor tes membantu penyelidik mengidentifikasi variabel yang
penting yang mempengaruhi kinerja pada prestasi heterogen. Misalnya, analisis
faktor skor subtest dari intelijen standar tes telah menggambarkan dimensi
kinerja yang penting pada tes, dan dimensi-dimensi ini telah diperiksa untuk
melihat apakah mereka memiliki nilai untuk diagnosa dan menjelaskan
ketidakmampuan belajar
2. Mardapi
(2017:
Dalam
bukunya Pengukuran, Penilaian, dan Evaluasi Pendidikan, Mardapi (2017: 32-45)
menyampaikan validitas-validitas tersebut dengan cara yang berbeda. Berdasarkan
tujuan penggunaan tes, bukti validitas dikelompokkan menjadi empat, yaitu bukti
berdasarkan isi tes, bukti berdasarkan proses respons, bukti berdasarkan
struktur internal, dan bukti berdasarkan hubungan dengan variable lain.
a.
Bukti Berdasarkan isi tes
Berdasarkan
isi tes dapat dieroleh dari suatu analisis hubungan antara isi tes dan konstruk
yang ingin diukur. Isi tes pada tema, kata-kata, format butir, tugas, dan
pertannyaan tes, seperti juga prosedur administrasi dan penskoran. Bukti
validitas isi dapat diperoleh dari analisis hubungan antara isi tes dengan
konstruk yang ingin diukur. Bukti validitas isi sering dijelaskan dalam
validitas tampang (face validity) dan validitas logic (logical validity).
b.
Bukti berdasarkan respons.
Analisis
teori dan empiric terhadap proses respons peserta tes dapat memberi kesesuaian
antara konstruk dan respon peserta tes. Apabila tujuan tes tes untuk mengungkapkan kemampuan penalaran
marematika peserta didik, maka isi tes berupa pertanyaan terkait kemampuan
matematika.
c.
Bukti berdasarkan hubungan dengan
variable lain
Analisis
skor tes dengan variable ekternal dilakukan untuk melengkapi bukti validitas.
Variabel ekternal bisa berupa kriteria bahwa tes diharapkan memprediksi,
seperti hubungan dengan tes lain yang diduga mengukur konstrak yang sama dengan
tes lain yang mengukur hal yang berbeda. Kriteria lain seperti kriteria
performans sering digunakan untuk keperluan seleksi atau penempatan
kepegawaian. Bukti validitas dengan hubungan dengan variable lain sering
disebut dengan validitas terkait kriteria (criterion validity).
*) untuk bukti berdasarkan struktur internal
tidak terdapat pembahasan dalam poin tersendiri, namun apabila dipahami
penjelasannya tersirat masuk dalam bukti berdasarkan respons yang terdiri dari
validitas multutrait-multimetode dan validitas factorial.
No comments:
Post a Comment