Laily English: VALIDITAS: SUATU PENGANTAR

Validitas merupakan suatu ukuran yang menunjukkan kevalidan atau kesahihan suatu instrument. Suatu tes atau instrument memiliki validitas apabila tes/instrument tersebut mengukur apa yang seharusnya diukur. Sebagai contoh, sebuah tes untuk pelamar pekerjaan akan valid apabila tes itu mengukur kemampuan terkait kinerja di pekerjaan tersebut kelak (Allen & Yen, 1979: 95).

Pengertian serupa dirangkum Mardapi (2017: 32) dari Standard, 1999 yaitu validitas atau kesahihan menunjuk pada dukungan atau derajat bukti dan teori mendukungg penafsiran score tes sebagai tujuan penggunaan tes. Beliau mencontohkan apabila suatu tes matematika, maka penafsiran tes tersebut harus berdasarkan teori yang digunakan yaitu definisi tentang kemampuan matematika. Hal ini mengakibatkan validitas merupakan fundamen paling dasar dalam mengembangkan dan mengevaluasi suatu tes. Proses validasi akan mencakup pengumpulan bukti-bukti untuk menunjukan dasar keilmiahan penafsiran skor seperti yang direncanakan. Validitas adalah penafsiran skor tes seperti yang tercantum pada tujuan penggunaan tes, bukan tes itu sendiri. Apabila skor tes ditafsirkan lebih dari satu makna, setiap penafsiran atau pemaknaan harus divalidasi (Standard, 1999).

Validitas dapat dinilai melalui beberapa cara tergantung pada tes dan tujuan penggunaannya. Berikut cara penilaian validitas menurut beberapa ahli.

1. Allen & Yen (1979: 95-114)

Allen & Yen (1979: 95-114) menyampaikan tiga jenis validitas yang utama, yaitu: content validity (validitas isi), criterion-related validity, dan construct validity.

a. Content validity

Content validity dikembangkan melalui sebuah Analisa rasional tentang isi tes dan penentuannya berdasarkan penilaian subjektif individu. Ada dua jenis utama validitas isi, yakni face validity dan logical validity. Validitas muka terkadang disebut dengan validitas “armchair”. Validitas ini dikembangkan ketika seseorang memeriksa sebuah tes dan memutuskan bahwa tes ini menilai hal/ sifat yang relevan. Yang bisa melakukan penilaian ini bisa siapapun dari ahli sampai orang yang mengikuti tes tersebut. Jika orang-orang tidak setuju, validitas muka tersebut dipertanyakan. Validitas muka bisa jadi cukup untuk menilai suatu tes misalnya tes atau ujian di kelas. Contohnya, tes aritmatika, dalam validitas mukanya mengukur kemampuan aritmatika.

1) Validitas muka/ face validity

Validitas muka/ face validity bisa menjadi penting untuk beberapa hal sebafai contoh suatu tes seleksi pekerjaan. Apabila tes itu tidak mengukur keterampilan calon pekerja dalam pekerjaannya kelak, maka hal ini akan menjadi hal yang kurang baik untuk divisi Humas di perusahaan tersebut apabila validitas muka tidak terpenuhi. Validitas muka bisa menjadi penting untuk penerapan tes-tes tertentu, namun, bisa jadi tidak terlalu penting di tes lainnya ketika validitas lainnya telah terpenuhi.

2) Validitas logis/ logical validity

Selanjutnya validitas isi yang kedua adalah logical atau sampling validity. Validitas ini lebih komplek dari validitas muka. Validitas ini melibatkan pengertian dan domain sikap yang akan diukur serta desain logis untuk mencakup seluruh area penting dalam domain tersebut. Validitas logis biasanya sangat bermanfaat dalam tes prestasi.

Karena validitas isi didasarkan pada penilaian subjektif, penentuan nilai validitas ini lebih rentan terhadap kesalahan/error dibandingkan validitas lainnya. Akan tetapi, memenuhi validitas isi menjadi pertimbangan utama dalam pengembangan suatu tes dan butir-butir soal dikembangkan untuk memenuhi validitas isi. Melalui sebuah Teknik analisis butir, tes bisa ditingkatkan dan dikembangkan untuk jaminan bahwa aspek lain penilaian telah terpenuhi. Akan tetapi biasanya pemenuhan validitas isi saja tidaklah cukup, validitas lain perlu dipenuhi. Salah satu validitas tersebut adalah validitas terkait kriteria atau criterion-related validity.

b. criterion-related validity.

Validitas terkait kriteria digunakan ketika skor tes bisa dihubungkan dengan kriteria. Kriteria tersebut adalah beberapa sikap yang diprediksi melalui tes. Sebagai contoh, untuk memperoleh validitas kriteria ini, skor sebuah tes penyaringan pekerja harus disesuaian dengan kriteria keefektifan pekerjaan. Atau untuk memperoleh validitas kriteria, skor dalam penerimaan siswa baru harus dihubungkan dengan kriteria tertentu misalnya IPK dari siswa/mahasiswa dan presentasi siswa yang bisa menyelesaikan program tersebut.

Validitas kriteria biasanya disampaikan dalam sebuah koofesisian hubungan yaitu hubungan antara skor tes (predictor) dengan skor kriteria. Korelasi ini disimbolkan dengan ρxy, di mana X adalah skor tes (predictor) dan Y adalah skor kriteria. Koefisien validitas. ρxy dihitung melalui satu atau dua cara yaitu perhitungan validitas prediktif (predictive validity) dan perhitungan validitas bersamaan (concurrent validity).

1) validitas prediktif (predictive validity)

Validitas prediktif ini melibatkan penggunaan skor tes untuk memprediksi sikap di masa yang akan dating. Koefisien validitas prediktif didapatkan dengan memberikan tes ke beberapa orang yang relevan/ tepat kemudian menunggu beberapa kurun waktu untuk mengumpulkan skor kriteria dan menghitung koefisien validitasnya. Sebagai contoh, validitas prediktif dalam tes penyaringan pegawai digunakan untuk mengetas semua calon, lalu mempekerjakan seluruh pelamar, dan kemudian menunggu beberapa minggu atau bulan sampai akhirnya kriteria dapat dihitung secara reliabel misalnya melalui rating atasan atau penilaian kinerja. Prosedur ini akan memberikan informasi seberapa bagus skor tes dalam memprediksi sikap di masa yang akan datang. Kelemahannya, tes ini memakan banyak waktu dan biaya. Jika pemberi pekerjaan tidak ingin mempekerjakan semua pelamar, maka akan ada batasan baik dalam predictor maupun kriteria. Ketika suatu tes digunakan untuk mengukur atau memperkirakan sikap di masa yang akan datang maka validitas prediktif digunakan.

2) validitas bersamaan (concurrent validity).

Namun selain validitas prediktif, sebuah alternative untuk mengukur hal serupa adalah penggunaan koefisien validitas bersamaan atau concurrent validity coefficient. Validitas ini adalah hubungannya tes dengan kriteria yang keduanya diukur dalam waktu bersamaan. Sebagai contoh, penghitungan skor predictor dan kriteria dalam suatu pekerjaan dalam waktu bersamaan. Kelemahan Teknik ini adalah keterbatasan ruang karena pekerja yang menunjukkan performa kurang baik pasi dipecat dan pelamar yang skor tesnya tidak memenuhi syarat tidak akan diterima. Concurrent validity coefficient tepat digunakan ketika skor tes digunakan untuk menilai kinerja saat ini dan bukan memprediksi kriteria di masa yang akan datang.

c. Validitas konstruk/construct validity

Validitas jenis ketiga adalah validitas konstruk/construct validity. Validitas konstruk adalah derajat di mana tes ini mengukur konstruk teoretis dan sikap yang seharusnya diukur. Mengembangkan validitas kosntruk adalah sebuah proses terus menerus. Berdasarkan teori terkait trait/sifat yang akan diukur, seorang pengembang tes memprediksi bagaimana tes harus ber[erilaku dalam berbagai situasi.

Prediksi ini kemudian diuji. Jika prediksi didukung oleh data, validitas konstruk meningkat. Jika prediksi tidak didukung oleh data, setidaknya ada tiga kesimpulan alternatif itu dapat ditarik: (1) percobaan itu cacat, (2) teorinya salah dan harus direvisi, atau (3) tes tidak mengukur sifat. Meskipun membangun membangun validitas adalah proses tanpa akhir, pengembang tes dapat menunjukkan membangun validitas untuk ujian dalam situasi tertentu.

Setiap prediksi yang dapat diuji dapat dibuat untuk mendukung validitas konstruk, termasuk prediksi validitas konten dan terkait kriteria. Prediksi lain yang mungkin termasuk:

1. Perbedaan kelompok. Jika teori ini menyiratkan perbedaan kelompok (atau tidak ada perbedaan kelompok) dalam skor tes, prediksi ini dapat dipelajari dengan mengumpulkan data dan melakukan uji statistik hipotesis yang masuk akal. Sebagai contoh, satu mungkin memprediksi perbedaan antara anak-anak dan orang dewasa pada tes kematangan sosial, atau orang mungkin memprediksi tidak ada perbedaan di antara kelompok-kelompok budaya pada "culturefair" tes kemampuan.

2. Perubahan. Teori ini dapat menyiratkan bahwa skor tes berubah seiring waktu atau setelahnya intervensi eksperimen. Misalnya, tes yang mengukur komunikasi lisan keterampilan harus menghasilkan skor yang lebih tinggi ketika anak-anak tumbuh dewasa atau ketika anak-anak mengikuti kelas yang relevan di sekolah. Teori ini juga dapat memprediksi perubahan dalam beberapa skor tapi tidak untuk hal-hal yang lain. Misalnya, pengalaman pelatihan ketegasan harus mampu meningkatkan skor “ketegasan” tetapi tidak mempengaruhi skor kosa kata/ vocabulary.

3. Korelasi. Teori ini mungkin mengarahkan pengembang pengujian untuk memprediksi satu atau lebih itu korelasi apakah positif, negatif, atau nol. Sebagai contoh, kita mungkin mengharapkan skor pada tes memori jangka pendek untuk berkorelasi positif dengan usia dan tidak berkorelasidengan seks. Prediksi dapat melibatkan kumpulan korelasi.

4. Proses. Misalkan tes penalaran matematis berisi masalah kata itu menggunakan kata-kata yang sangat sulit. Berdasarkan satu teori kita dapat memprediksi semua peserta ujian sedang memproses atau memikirkan soal-soal ujian dengan cara yang sama. Namun, teori lain mungkin menuntun kita untuk berharap bahwa beberapa peserta ujian mungkin bisa untuk melakukan matematika tetapi tidak dapat memulai masalah karena kosa kata mereka lemah. Dalam contoh ini tes mengukur penalaran matematis untuk beberapa orang tingkat ujian dan kosakata untuk peserta ujian lainnya. Pemeriksaan barang konten dan korelasi antara skor item atau analisis wawancara dengan peserta ujian saat mereka menyelesaikan soal-soal ujian dapat membantu kita memilih di antara teori tentang proses kognitif yang mendasari solusi untuk item tes. Mungkin juga begitu masuk akal untuk memprediksi bahwa proses yang berbeda terjadi di antara individu atau kelompok yang berbeda. Misalnya, ada perbedaan jenis kelamin pada sebagian besar tes penalaran spasial. Seorang peneliti dapat memperkirakan bahwa kedua jenis kelamin akan diproses item tes spasial dengan cara yang berbeda dan kemudian menguji prediksi ini.

Beberapa aspek yang ada dalam konstruk validitas akan dijabarkan dalam penjelasan berikut ini.

1) Validitas Multitrait-Multi metode

Validitas multitrait-multi metode adalah aspek validitas konstruk yang dulu dikembangkan oleh Campbell dan Fiske (1959). Metode ini digunakan saat dua atau lebih sifat-sifat diukur dengan dua metode atau lebih. Misalkan dua sifat introversi dan neurotisme diukur dengan dua metode, soal true-false (T-F) dan soal pilihan ganda (M-C). Keempat tes diberikan kepada sampel orang, dan matriks validitas multitrait-multimethod yang dihasilkan muncul pada Tabel 5.9 ini. Matriks validitas itu mirip dengan matriks korelasi, yang merupakan tampilan persegi panjang dari korelasi. Korelasi muncul di persimpangan setiap baris dan kolom korelasi antara skor pelabelan baris dan kolom itu. Misalnya, korelasi antara skor T-F neurotisme dan skor T-F introversi adalah 0,20. Biasanya matriks korelasi memiliki 1.0s onits utama diagonal (yang berjalan dari atas sudut kiri ke sudut kanan bawah matriks); yaitu korelasi masing-masing variabel dengan dirinya sendiri, menurut definisi, sama dengan 1.0. Metode multitrait-multimetode matriks validitas adalah matriks korelasi dengan 1.0s digantikan oleh estimasi reliabilitas. Misalnya, perkiraan reliabilitas skor T-F introversi adalah 80.

Pertimbangkan properti yang harus dimililiki oleh matriks multitrait-multimethod ini. Keandalan di diagonal utama harus besar. Korelasi antara dua ukuran yang berbeda dari satu sifat juga harus tinggi. Korelasi antara ukuran sifat yang tidak terkait harus rendah. Korelasi antara skor tes mengukur sifat yang berbeda harus lebih kecil dari korelasi antara skor tes mengukur sifat yang sama. Tabel 5.9 merangkum hasil validitas multitrait-multi metode untuk sifat-sifat A dan B diukur dengan metode 1 dan 2.

Dua tipe utama validitas multitrait-multimethod diilustrasikan dalam Tabel 5.10: validitas konvergen dan validitas diskriminan. Validitas konvergen ditunjukkan oleh korelasi tinggi antara skor pada tes yang mengukur sifat yang sama dengan metode yang berbeda (misalnya, rA1A2, rb b2). Korelasi tinggi ini menunjukkan bahwa tes menyatu pada sifat tersebut. Validitas diskriminan ditunjukkan oleh korelasi yang rendah antara skor pada tes yang mengukur sifat yang berbeda (misalnya, rAlBl, rA1B2, rA2Bl, RA2B2), terutama ketika menggunakan metode yang sama (rAlBl, rA2B2) . Korelasi rendah ini menunjukkan bahwa tes membedakan antara berbagai sifat. Korelasi dalam Tabel 5.9 menunjukkan kedua validitas, baik validitas multitrait-multimethod diskriminatif dan konvergen.

Ketika ada lebih dari dua sifat atau metode, metode multitrait-multimetode matriks validitas lebih besar dan sedikit lebih rumit. Namun, jenis yang sama pola harus terjadi untuk menunjukkan validitas konvergen dan diskriminan. Pola korelasional itu harus memiliki nilai tinggi untuk reliabilitas dan korelasi internal, nilai rendah untuk korelasi lintas sifat, dan korelasi yang menunjukkan hal itu tidak ada bias karena metode. Metode bias hadir jika korelasi antara skor untuk sifat yang berbeda lebih tinggi ketika metode yang sama digunakan untuk mengukur keduanya sifat daripada ketika metode yang berbeda digunakan untuk mengukur sifat. Misalnya, jika rAlBl dan rA2b2 jauh lebih besar daripada rA lB2 dan rA2B1, bias metode disarankan karena korelasi yang lebih besar ketika sifat-sifat tersebut diukur dengan metode yang sama. Namun jika rA1B1 hampir sama dengan rA1B2, rA2B1, dan rA2B2, ada bukti bahwa sifat-sifat diukur tanpa bias metode.

2) Validitas faktorial

Validitas faktorial adalah suatu bentuk validitas konstruk yang ditetapkan melalui analisis faktor. Analisis faktor adalah istilah yang mewakili sejumlah besar perbedaan prosedur matematis untuk menganalisis keterkaitan di antara seperangkat variabel dan untuk menjelaskan keterkaitan ini dalam jumlah variabel yang dikurangi, yang disebut faktor. Suatu faktor adalah variabel hipotetis yang mempengaruhi skor pada satu atau lebih variabel yang diamati. Sebagai contoh, lihatlah matriks korelasi pada Tabel 5.11. Meskipun ada tiga skor tes yang berkorelasi, jelas bahwa hanya satu faktor yang diukur, karena tingginya korelasi antar nilai ujian. Alih-alih membutuhkan tiga skor untuk setiap orang, satu skor saja cukup.

Pertimbangkan korelasi pada Tabel 5.12. Dua faktor sedang diukur oleh empat tes; tes 1 dan 2 mengukur satu faktor, dan tes 3 dan 4 mengukur faktor yang lain. Kedua faktor tersebut tidak berkorelasi, karena dua pasang tes tidak berkorelasi, seperti yang ditunjukkan oleh nol dalam matriks.

Sekarang perhatikan korelasi pada Tabel 5.13. Sekali lagi, dua faktor sedang diukur; tes 1 dan 2 mengukur satu faktor, dan tes 3 dan 4 mengukur yang lain faktor. Namun, kali ini kedua faktor tersebut tampaknya sedikit berkorelasi, seperti ditunjukkan oleh korelasi rendah (.10, .20, dan .30) dalam matriks.

Contoh-contoh sebelumnya melibatkan metode analisis faktor "bola mata". Dari pemeriksaan visual hanya dari matriks, jelas berapa banyak factor yang ada. Namun, ketika ada banyak variabel dalam matriks korelasi dan hubungan timbal balik di antara mereka sangat kompleks, tidak begitu mudah untuk ditentukan berapa banyak faktor yang ada, dan bahkan para ahli mungkin tidak setuju pada jumlah factor dan hubungan timbal balik mereka. Namun, logika yang mendasari contoh sederhana kami tetap sama untuk kasus kompleks.

Analisis faktor seperangkat skor tes membantu penyelidik mengidentifikasi variabel yang penting yang mempengaruhi kinerja pada prestasi heterogen. Misalnya, analisis faktor skor subtest dari intelijen standar tes telah menggambarkan dimensi kinerja yang penting pada tes, dan dimensi-dimensi ini telah diperiksa untuk melihat apakah mereka memiliki nilai untuk diagnosa dan menjelaskan ketidakmampuan belajar

2. Mardapi (2017:

Dalam bukunya Pengukuran, Penilaian, dan Evaluasi Pendidikan, Mardapi (2017: 32-45) menyampaikan validitas-validitas tersebut dengan cara yang berbeda. Berdasarkan tujuan penggunaan tes, bukti validitas dikelompokkan menjadi empat, yaitu bukti berdasarkan isi tes, bukti berdasarkan proses respons, bukti berdasarkan struktur internal, dan bukti berdasarkan hubungan dengan variable lain.

a. Bukti Berdasarkan isi tes

Berdasarkan isi tes dapat dieroleh dari suatu analisis hubungan antara isi tes dan konstruk yang ingin diukur. Isi tes pada tema, kata-kata, format butir, tugas, dan pertannyaan tes, seperti juga prosedur administrasi dan penskoran. Bukti validitas isi dapat diperoleh dari analisis hubungan antara isi tes dengan konstruk yang ingin diukur. Bukti validitas isi sering dijelaskan dalam validitas tampang (face validity) dan validitas logic (logical validity).

b. Bukti berdasarkan respons.

Analisis teori dan empiric terhadap proses respons peserta tes dapat memberi kesesuaian antara konstruk dan respon peserta tes. Apabila tujuan tes tes untuk mengungkapkan kemampuan penalaran marematika peserta didik, maka isi tes berupa pertanyaan terkait kemampuan matematika.

c. Bukti berdasarkan hubungan dengan variable lain

Analisis skor tes dengan variable ekternal dilakukan untuk melengkapi bukti validitas. Variabel ekternal bisa berupa kriteria bahwa tes diharapkan memprediksi, seperti hubungan dengan tes lain yang diduga mengukur konstrak yang sama dengan tes lain yang mengukur hal yang berbeda. Kriteria lain seperti kriteria performans sering digunakan untuk keperluan seleksi atau penempatan kepegawaian. Bukti validitas dengan hubungan dengan variable lain sering disebut dengan validitas terkait kriteria (criterion validity).

*) untuk bukti berdasarkan struktur internal tidak terdapat pembahasan dalam poin tersendiri, namun apabila dipahami penjelasannya tersirat masuk dalam bukti berdasarkan respons yang terdiri dari validitas multutrait-multimetode dan validitas factorial.

Labels

Sunday, November 17, 2019

VALIDITAS: SUATU PENGANTAR

No comments:

Post a Comment

Perjuangan 5 Besar: Calon Duta Teknologi DIY 2024