- Back to Home »
- VALIDITAS DAN REALIBILITAS
Posted by : matematikaunm8.blogspot.com
Rabu, 12 Maret 2014
Validitas Instrumen
Pengertian
Karakter pertama dan memiliki peranan
sangat penting dalam instrument evaluasi adalah valid. Suatu instrument
dikatakan valid, seperti yang duterangkan oleh Gay (1983) dan Johnson
& Johnson (2002), apabila instrument yang digunakan dapat mengukur
apa yang seharusnya diukur (Sukardi, 2008).
Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam Arikunto, 1997) bahwa “A test is valid if it measures what is purpose to measure”.
Atau jika diartikan krang lebih, sebuah tes dikatakan valid apabila tes
tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia
“Valid” disebut dengan istilah “Sahih”.
Menurut Sukardi (2008: 31) validitas
instrument suatu evaluasi, tidak lain adalah derajat yang menunjukkan
dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu
instrument evaluasi mempunyai beberapa makna penting diantaranya seperti
berikut:
1) Validitas berhubungan dengan
ketepatan interpretasi hasil tes atau instrument evaluasi untuk group individual dan bukan instrument itu sendiri.
2) Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori rendah, menengah dan tinggi.
3) Prinsip suatu tes valid, tidak
universal. Validitas suatu tes yang perlu diperhatikan oleh para
peneliti adalah bahwa Ia hanya valid untuk suatu tujuan tertentu saja.
Macam-macam Validitas
Menurut Sukardi (2008) secara metodologis
validitas suatu tes dapat dibedakan menjadi empat macam, yaitu
validitas isi, validitas konstruk, validitas konkruen dan validitas
prediksi. Macam-macam validitas tersebut akan diuraikan sebagai berikut:
1) Validitas isi
Yang dimaksud validitas isi ialah derajat
dimana sebuah tes evaluasi mengukur cakupan substansi yang ingin
diukur. Untuk mendapatkan validitas isi memerlukan dua spek penting,
yaitu valid isi dan valid teknik sampling.Valid isi mencakup khususnya,
hal-hal yang berkaitan dengan apakah item-item evaluasi menggambarkan
pengukuran dalam cakupan yang ingin diukur. Sedangkan validitas teknik
sampling pada umunya berkaitan dengan bagaimanakah baiknya suatu sampel
tes mempresentasikan total cakupan isi (Sukardi, 2008).
Sedangkan Arikunto (1997: 64) sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu
yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh
karena materi yang diberikan tertera dalam kurikulum maka validitas isi
juga disebut validitas kurikuler.
2) Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara atau Hyptotetical construct.
Secara definitife, konstruk merupakan suatu sifat yang tidak dapat
diobservasi, tetapi kita dapat merasakan pengaruhnya melalui salah satu
atau dua indera kita (Sukardi, 2008).
Sedangkan Arikunto(1997: 64) sebuah tes
dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berfikir seperti disebutkan
dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir
soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir
yang menjadi tujuan instruksional.
3) Validitas Konkruen
Validitas konkruen adalah derajat dimana
skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Tes
dengan validitas konkruen biasanya diadministrasi dalam waktu yang sama
atau dengan criteria valid yang sudah ada. Sering kali juga terjadi
bahwa tes dibuat atau dikembangkan untuk pekerjaan yang sama seperti
beberapa tes lainnya, tetapi dengan cara yang lebih mudah dan lebih
cepat. Validitas konkruen ditentukan dengan membangun analisis hubungan
dan perbedaan (Sukardi, 2008).
4) Validitas Prediksi
Validitas prediksi adalah derajat yang
menunjukkan suatu tes dapat memprediksi tentang bagaimana baik seseorang
akan melakukan suatu prospek atau tugas atau pekerjaan yang
direncanakan. Validitas prediksi suatu tes pada umumnya ditentukan
dengan membangun hubungan antara skor tes dan beberapa ukuran
keberhasilan dalam situasi tertentu yang digunakan untuk memprediksi
keberhasilan, yang selanjutnya disebut sebagai predictor. Sedangkan
tingkah laku yang diprediksi disebut criterion (Sukardi, 2008).
Sedangkan menurut Arikunto(1997: 66)
memprediksi artinya meramal, dan meramal selalun mengenai hal yang akan
datang jika sekarang belum terjadi. Sebuah tes memiliki validitas
prediksi atau validitas ramalan apabila mempunyai kemampuan untuk
meramalkan apa yang akan terjadi pada masa yang akan datang.
Faktor-faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi
hasil tes evaluasi tidak valid. Beberapa faktor tersebut secara garis
besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes,
faktor eksternal tes, dan faktor yang berasal dari siswa yang
bersangkutan.
1) Faktor yang berasal dari dalam tes
- Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes
- Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit
- Item tes dikonstruksi dengan jelas.
- Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
- Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
- Jumlah item terlalu sedikit sehingga tidak mewakili sampel
- Jawaban masing-masing item evaluasi bisa diprediksi siswa
2) Faktor yang berasal dari administrasi dan skor tes.
- Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi tergesa-gesa.
- Adanya kecrangan dalam tes sehingga tidak membedakan antara siswa yang belajar dengan melakukan kecurangan.
- Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua siswa.
- Teknik pemberian skor yang tidak konsisten.
- Siswa tidak dapat memngikuti arahan yang diberikan dalam tes baku.
- Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang diberikan.
3) Faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi
terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh
jawaban siswa dari pada interpretasi item-item pada tes evaluasi
(Sukardi, 2008).
Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas
jika hasilnya sesuai dengan kriterium, dalam arti memilki kesejajaran
antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk
mengetahui kesejajaran adalah dengan teknik korelasi product moment yang
dikemukakan oleh pearson (Arikunto, 1997)
Reliabelitas Instrumen
Pengertian
Menurut Sukardi (2008: 43) relaibelitas
adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan
sama dengan konsistensi atau keajegan. Suatu instrument evaluasi
dikatakan mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat
mempunyai hasil konsisten dalam mengukur yang hendak diukur.
Sehubungan dengan reliabelitas ini
Scarvia B. Anderson dan kawan-kawan (dalam Arikunto, 1997) menyatakan
bahwa persyaratan bagi tes, yaitu validitas dan reliabelitas ini
penting. Dalam hal ini validitas lebih penting, dan reliabelitas ini
perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin
reliable tapi tidak valid. Sebaliknya tes yang valid biasanya reliable.
Aspek-Aspek Reliabelitas
Menurut Sukardi (2008) Ada beberapa tipe
reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing
reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe
reliebelitas di antaranya: tes-retes, ekivalen, dan belah dua yang
ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1) Relibalelitas Dengan Tes-Retes (Stabilitas)
Reliabelitas tes-retes tidak lain adalah
derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke
waktu. Tes-Retes menunjukkan variasi skor yang diperoleh dari
penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali atau lebih,
sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik
dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu
tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes
yang sama. Dengan melakukan tes-retes tersebut. Seorang guru akan
mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin
diukur (Sukardi, 2008).
Sedangkan Arikunto (1997: 88) Metode tes
ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri
tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki
satu seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan
dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
- Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
- Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
- Korelasikan kedua hasil tes tersebut.
Jika hasil koefisien menunjukkan tinggi,
berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah,
berarti tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).
2) Reliabelitas Dengan Bentuk Ekivalensi (Keekuivalenan)
Sesuai dengan namanya yaitu ekivalen,
maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik
dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada,
dapat berbeda. Kedua tes tersebut sebaliknya mempunyai karate yang sama.
Karakteristik yang dimaksud misalnya mengukur variabel yang sama,
mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan
dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama
(Sukardi 2008).
Pernyataan serupa juga disampaikan oleh
Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi
butir-butirnya berbeda. Dalam istilah bahasa Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:
- Tentukan sasaran yang hendak dites
- Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
- Administrasinya hasilnya secara baik.
- Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut
- Korelasikan kedua hasil skor tersebut (Sukardi, 2008).
Perlu diketahui juga bahwa tes ekivalensi
mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara
esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan
pengukuran (Sukardi, 2008). Pernyataan lain juga disampaikan oleh
Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes
pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus
tersedia waktu yang lama untuk mencobakan dua kali tes.
3) Reliebilitas Dengan Bentuk Belah Dua (Kekonsistenan Secara Internal)
Menurut Sukardi (2008: 47) Reliabilitas
belah dua ini termasuk reliabilitas yang mengukur konsistensi internal.
Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas
yang didasarkan pada keajegan dalam setiap item tes evaluasi.
Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai berikut:
- Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
- Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.
- Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
- Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran (Sukardi, 2008).
Pada cara ini, soal diujicobakan kepada peserta didik dan
hasilnya dibelah menjadi dua, yaitu belahan gasal dan belahan genap. Dalam hal
ini jumlah butir soal harus genap. Kedua skor hasil belahan dikorelasikan dengan
rumus product moment, hasilnya adalah relasi belahan r ½ ½ . Setelah ditemukan
korelasi belahan, dihitung angka reliabilitas soal dengan rumus Spearman-Brown.
Rumus Spearman-Brown adalah sebagai berikut:
Adapun cara lain yaitu
Reliabilitas empiris soal uraian
Untuk
soal uraian, koefisien reliabilitasnya dihitung dengan rumus alpha Cronbach yang rumusnya adalah:
keterangan : SBt = simpangan baku total
SB1 = simpangan
baku butir
Butir yang dimasukkan dalam rumus di atas hanya butir yang
valid, sedangkan butir yang tidak valid (gugur), tidak diperhitungkan. Oleh
karenanya reliabilitas hanya dihitung dari butir yang valid. Kriteria
reliabilitas soal sama dengan soal bentuk objektif, yaitu soal reliabel bila
r11 lebih dari sama dengan 0,70.
Cara Kuder Richardson 20
Rumus
lain yang lebih banyak digunakan untuk menghitung koefisien konsistensi
internal adalah rumus Kuder Richardson 20 (KR20). Cara ini menghasilkan angka yang lebih tepat. Rumus KR20 adalah :
keterangan :
SB2t
= simpangan baku dari skor total
r11 = reliabilitas soal
Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien
reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes.
Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan
mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga
mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai
berikut::
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.
2) Penyebaran skor, koefisien
reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam
kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi
estimasi koefisien reliable.
3) Kesulitan tes, tes normative yang
terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan
skor reliabilitas rendah.
4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.