VALIDITAS
DAN RELIABILITAS
makalah ini
diajukan untuk memenuhi salah satu tugas matakuliah
“MODEL PENILAIAN KELAS”
Disusun oleh:
Qurriyatul
Munawwaroh 210311149
Dosen pengampu:
Drs. Ju’ Subaidi.
M.Ag
JURUSAN TARBIYAH
PROGRAM STUDI
PENDIDIKAN AGAMA ISLAM
SEKOLAH TINGGI AGAMA
ISLAM NEGERI
(STAIN) PONOROGO
DESEMBER 2013
BAB I
PENDAHULUAN
A.
Latar
Belakang Masalah
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh
untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun
butir soal yang menjadi bagian dari tes tersebut. Dalam penilaian hasil
belajar, tes diharapkan dapat menggambarkan sampel perilaku dan menghasilkan
nilai yang obyektif dan akurat.
Dalam praktik evaluasi di sekolah, sering kali guru acuh tak acuh
dengan kualitas suatu tes. Artinya, apakah suatu tes termasuk baik atau tidak,
guru tidak mau tahu, yang penting bagi guru adalah tersedianya perangkat tes
untuk melaksanakan penilaian.[1]
Analisis kualitas tes menunjuk pada dua hal pokok, yaitu validitas
dan reliabilitas. Kedua hal ini sekaligus merupakan karakteristik alat ukur yang
baik. Dalam makalah ini akan dijelaskan mengenai validitas dan reliabilitas.
B.
Rumusan
Masalah
1.
Apa
Pengertian Validitas?
2.
Apa
Saja Macam-macam Validitas?
3.
Bagaimana
Cara Menghitung Validitas?
4.
Apa
Saja Faktor-faktor yang Mempengaruhi Validitas?
5.
Apa
Pengertian Reliabilitas?
6.
Bagaimana
Cara-cara Mencari Besarnya Reliabilitas?
7.
Apa
Saja Faktor-faktor yang Mempengaruhi Reliabilitas?
BAB II
PEMBAHASAN
A.
Pengertian
Validitas
Validitas berasal dari kata validity yang mempunyai arti
sejauhmana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam
melakukan fungsi ukurnya.[2] Validitas
(kesahihan) adalah kualitas yang menunjukkan hubungan antara suatu pengukuran
(diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku.
Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu
teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut valid) jika
teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur.[3]
Sebelum digunakan dalam kegiatan belajar mengajar, hendaknya paket
pengajaran telah mempunyai status “valid”. Untuk dapat mencapai validitas ini,
paket pengajaran tersebut perlu melalui proses tryout atau uji coba.[4]
Selanjutnya, Kerlinger (1986) mengemukakan, “validitas instrumen
tidak cukup ditentuikan oleh derajat ketepatan instrumen untuk mengukur apa
yang seharusnya dapat diukur, tetapi perlu juga dilihat dari tiga kriteria yang
lain, yaitu appropriatness, meaningfullness, dan usefullness.”
Appropriatness menunjukkan kelayakan dari tes sebagai suatu instrumen,
yaitu seberapa jauh instrumen dapat menjangkau keragaman aspek perilaku peserta
didik. Meaningfullness menunjukkan kemampuan instrumen dalam memberikan
keseimbangan soal-soal pengukurannya berdasar tingkat kepentingan dari setiap
fenomena. Usefullness to inferences menunjukkan sensitif tidaknya
instrumen dalam menangkap fenomena perilaku dan tingkat ketelitian yang
ditunjukkan dalam membuat kesimpulan.[5]
B.
Macam-macam
Validitas
Dalam evaluasi pendidikan, validitas suatu tes dapat dibedakan
menjadi empat macam, yaitu validitas isi, validitas konstruk, validitas
konkuren, dan prediksi yang akan diuraikan dengan lebih jelas seperti berikut.[6]
1.
Validitas
Isi
Yang dimaksud validitas isi ialah
derajat dimana sebuah tes evaluasi mengukur cakupan substansi yang ingin
diukur. Untuk mendapatkan validitas isi memerlukan dua aspek penting, yaitu
valid isi dan valid teknik sampling. Valid isi mencakup khususnya hal-hal yang
berkaitan dengan apakah tem-item evaluasi menggambarkan pengukuran dalam
cakupan yang inging diukur. Sedangkan validitas teknik sampling pada umumnya
berkaitan dengan bagaimanakah baiknya suatu sampel item tes mempresentasikan
total cakupan isi.
Validitas isi juga mempunyai peran
yang sangat penting untuk tes pencapaian hasil belajar. Validitas isi pada
umumnya ditentukan melalui pertimbangan para ahli. Tidak ada formula matematis
untuk menghitung dan tidak ada cara untuk menunjukkannya secara pasti. Akan
tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi dengan
menggunakan validitas isi, pertimbangan para ahli tersebut dilakukan dengan
cara seperti berikut.
Pertama, para ahli diminta untuk
mengamati secara cermat semua item dalam tes yang hendak divalidasi. Kemudian
mereka diminta untuk mengoreksi interpretasi item-item yang telah dibuat. Pada
akhir perbaikan, mereka juga diminta untuk memberikan pertimbangan tentang
bagaimnana baik interpretasi tes evaluasi tersebut menggambarkan cakupan isi
yang hendak diukur.[7]
2.
Validitas
Konstruk
Validitas konstruk merupakan derajat
yang menunjukkan suatu tes mengukur sebuah konstruk sementara. Konstruk secara
definitif, merupakan suatu sifat yang tidak dapat diobservasi, tetapi kita dapat
merasakan pengaruhnya melalui satu atau dua indra kita. Dalam dunia pendidikan,
contoh yang menyangkut konstruk, misalnya ketakutan, kreativitas, semangat, dan
sebagainya.
Proses melakukan validasi konstruk
dapat dilakukan dengan cara melibatkan hipotesis testing yang dideduksi dari
teori yang menyangkut dengan konstruk yang relevan. Misalnya jika suatu teori
kecemasan menyatakan bahwa seseorang yang memiliki kecemasan lebih tinggi akan
bekerja lebih lama dalam menyelesaikan suatu masalah, dibanding orang yang memiliki
tingkat kecemasan rendah.[8]
3.
Validitas
Konkuren
Validitas konkuren adalah derajat
dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat.[9] Validitas
ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengalaman.[10] Validitas
konkuren ditentukan dengan membangun
analisis hubungan atau pembedaan. Cara-cara membuat tes dengan validitas
konkuren dapat dilakukan dengan beberapa langkah sebagai berikut.
a.
Administrasikan
tes yang baru dilakukan terhadap grup atau anggota kelompok.
b.
Catat
tes baku yang ada termasuk beberapa koefisien validitasnya jika ada.
c.
Hubungkan
atau korelasikan dua tes skor tersebut.
Hasil yang dicapai atau koefisien
validitas yang muncul menunjukkan derajat hubungan validitas tes yang baru.
Jika koefisien tinggi, berarti tes yang baru tersebut mempunyai validitas
konkuren baik. Sebaliknya tes yang baru dikatakan mempunyai validitas konkuren
jelek, jika koefisien yang dihasilkan rendah.[11]
4.
Validitas
Prediksi
Validitas prediksi adalah derajat
yang menunjukkan suatu tes dapat memprediksi tentang bagiamana seseorang akan
melakukan suatu prospek tugas atau pekerjaan yang direncanakan.
Validitas prediksi suatu tes pada
umumnya ditentukan dengan membangun hubungan antara skor tes dan beberapa
ukuran keberhasilan dalam situasi tertentu yang digunakan untuk memprediksi
keberhasilan, yang selanjutnya disebut sebagai predictor. Sedangkan
tingkah laku yang hendak diprediksi pada umumnya disebut sebagai criterion.
Dalam membuat validasi prediksi,
suatu tes biasanya mempunyai sekuensi sebagai berikut. Pertama,
mengidentifikasi dan mendefinisikan secara teliti criterion yang hendak
diinginkan. Kriteria yang terpilih harus mengukur validitas terhadap tingkah
laku yang diprediksi. Ketika kriteria telah diidentifikasi dan ditentukan,
prosedur selanjutnya adalah menentukan validitas prediksi suatu tes.[12] Suatu
butir dinyatakan mempunyai validitas prediktif yang tinggi apabila butir
tersebut mampu memberikan nilai berbeda untuk individu yang berbeda berdasarkan
kriteria yang diprediksikan untuk masa mendatang.[13]
C.
Cara
menghitung Validitas alat ukur
Sebuah tes
dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti
memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang
digunakan untuk mengatuhi kesejajaran adalah teknik korelasi product moment
yang dikemukakakan oleh Pearson.
Rumus korelasi product
moment ada dua macam, yaitu:
a.
Korelasi
product moment dengan simpangan.
Rumus korelasi product moment dengan simpangan:
rxy =
dimana:
rxy = koefisien krelasi antara variabel X dan variabel
Y, dua variabel yang dikorelasikan (x = X- dan y = Y- ).
= jumlah perkalian x dan y
x2 = kuadrat
dari x
y2 = kuadrat dari y
b.
Korelasi
product moment dengan angka kasar.
Rumus korelasi product moment dengan angka kasar:
RXY =
Koefisien
korelasi selalu terdapat antara -1,00 sampai = 1,00. Namun karena dalam
menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh
koefisien lebih dari 1,00. Koefisien negatif menunjukkan hubungan kebalikan
sedangkan koefisien positif menunjukkan adanya kesejajaran untuk mengadakan interpretasi
mengenai besarnya koefisien korelasi adalah sebagai berikut:
Ø Antara 0,800 sampai dengan 1,00 : sangat tinggi
Ø Antara 0,600 sampai dengan 0,800 : tinggi
Ø Antara 0,400 sampai dengan 0,600 : cukup
Ø Antara 0,200 sampai dengan 0,400 : rendah
Ø Antara 0,00 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisien korelasi
ada dua cara yaitu:
1.
Dengan
melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup dan
sebagainya.
2.
Dengan
berkonsultasi ke tabel harga kritik r product moment sehingga dapat
diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari
harga kritik tabel, maka korelasi tersebut tidak signifikan. Begitu juga arti
sebaliknya.[14]
D.
Faktor-faktor
yang Mempengaruhi Validitas
1.
Faktor
yang berasal dari dalam tes
a.
Arahan
tes yang disusun dengan makna yang tidak jelas sehingga dapat mengurangi
validitas tes.
b.
Kata-kata
yang digunakan dalam strukutur instrument evaluasi, terlalu sulit.
c.
Item-item
tes dikontruksi dengan jelek.
d.
Tingkat
kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e.
Waktu
yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau
terlalu longgar.
f.
Jumlah
item terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran.
g.
Jawaban
masing-masing item evaluasi bisa diprediksi siswa.
2.
Faktor
yang berasal dari administrasi dan skor. Faktor ini dapat mengurangi validitas
interpretasi tes evaluasi, khususnya tes evaluasi yang dibuat oleh guru.
Berikut beberapa contoh faktor yang sumbernya berasal dari proses administrasi
dan skor.
a.
Waktu
pengajaran tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi
yang tergesa-gesa.
b.
Adanya
kecurangan dalam tes sehingga tidak bisa membedakan antara siswa yang belajar
dengan yang melakukan kecurangan.
c.
Pemberian
petunjuk dari pengawas yang tidak dapat dilakukan pada semua siswa.
d.
Teknik
pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat
mengurangi validitas tes evaluasi.
e.
Siswa
tidak dapat mengikuti arahan yang diberikan dalam tes baku.
f.
Adanya
joki (orang lain bukan siswa) yang masuk dan menjawab item tes yang diberikan.
3.
Faktor-faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa
interpretasi terhadap item-item evaluasi tidak valid, karena dipengaruhi oleh
jawaban siswa daripada interpretasi item-item pada tes evaluasi. Sebagai
contoh, sebelum tes para siswa menjadi tegang karena guru pengampu mata
pelajaran dikenal “killer”, galak dan sebagainya sehingga siswa yang ikut tes
banyak yang gagal.[15]
E.
Pengertian
Reliabilitas
Reliabilitas (keandalan) adalah ketetapan atau ketelitian suatu
alat evaluasi. Suatu tes dapat dikatakan andal jika ia dapat dipercaya,
konsisten, atau stabil dan produktif. Jadi, yang dipentingkan disini ialah
ketelitiannya: sejauh mana tes atau alat tersebut dapat dipercaya kebenarannya.[16]
Reliabilitas mengkaji ke-ajegan (stability) atau ketetapan
hasil tes manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu
kali, atau dari dua perangkat tes yang setara kepada obyek yang sama.[17] Reliabilitas
soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistensinan
suatu soal tes.[18]
F.
Cara-cara
mencari besarnya reliabilitas
Sekali lagi
reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama.
Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti
halnya beberapa teknik juga menggunakan rumus korelasi product moment
untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.[19]
1.
Metode
bentuk paralel (equivalent)
Sesuai dengan namanya, yaitu ekuivalen
maka tes yang hendak diukur reliabilitasnya dibuat identik. Setiap tampilannya,
kecuali substansi item yang ada dapat berbeda. Kedua tes tersebut sebaiknya
mempunyai karakteristik sama. Karakteristik yang dimaksud termasuk, misalnya
mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama,
mempunyai tingkat kesulitan dan mempunyai petunjuk, cara skoring, dan
interpretasi yang sama.
Langkah-langkah melaksanakan tes
reliabilitas diantaranya adalah sebagai berikut:
a.
Tentukan
subyek sasaran yang hendak dites.
b.
Lakukan
tes yang dimaksud kepada subjek sasaran tersebut.
c.
Administrasikan
hasilnya secara baik.
d.
Dalam
waktu yang tidak terlalu lama, lakukan pengetesan untuk yang kedua kalinya pada
grup tersebut.
e.
Korelaikan
kedua hasil tes skor.
Jika hasil
koefisien ekuivalen tinggi, berarti tes memiliki reliabilitas ekuialen baik.
Sebaliknya apabila ternyata bahwa koefisien rendah maka reliabilitas ekuivalen
rendah. Reliabilitas ekuivalen merupakan salah satu bentuk yang dapat diterima dan umum dipakai dalam penelitian, terutama
penelitian pendidikan.[20]
2.
Metode
tes ulang (tes-retest method)
Metode ini menunjukkan konsistensi
pengukuran dari waktu ke waktu dan menghasilkan koefisien reliabilitas yang
sering disebut koefisien stabilitas.[21]
Koefisien stabilitas adalah jenis
reliabilitas yang menggunakan teknik tes dan retest, yaitu memberikan tes
kepada sekelompok individu, kemudian diadakan pengulangan tes pada kelompok
yang sama dengan waktu yang berbeda.
Cara memperoleh koefisien stabilitas
adalah dengan mengorelasikan hasil tes pertama dengan hasil tes kedua dari
kelompok yang sama, tes yang sama, pada waktu yang berbeda.[22]
Jika hasil koefisien korelasi
menunjukkan tinggi, berarti reliabilitas tes adalah bagus. Sebaliknya, jika
korelasi rendah maka berarti bahwa tes tersebut mempunyai konsistensi rendah.[23]
3.
Metode
belah dua (split-half method)
Reliabilitas belah dua ini termasuk
reliabilitas yang mengukur konsistensi internal. Yang dimaksud dengan
konsistensi internal ialah salah satu tipe reliabilitas yang didasarkan pada
keajekan dalam tes. Reliabilitas belah dua ini pelaksanaannya hanya memerlukan
waktu satu kali.
Cara melakukan reliabilitas belah
dua pada garis besarnya dapat dilakukan dengan urutan sebagai berikut:
a.
Lakukan
pengetesan item-item yang telah dibuat kepada subyek sasaran.
b.
Bagi
tes yang ada menjadi dua atas dasar jumlah item yang paling umum dengan membagi
ganjil dan genap pada kelompok tersebut.
c.
Hitung
skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
d.
Korelasikan
kedua skor tersebut , menggunakan formula korelasi yang relevan dengan teknik
pengukuran.
Jika hasil koefisien korelasi tinggi
maka tes mempunyai tingkat reliabilitas baik. Akan dapat diartikan sebaliknya
jika hasil korelasi ternyata rendah.
Perlu diingat bahwa dari analisis
belah dua diatas, hasil korelasi yang muncul baru separo. Sebenarnya apa yang
kita kerjakan adalah menciptakan secara artifisial dua macam kelompok ekuivalen
dan menghitung bentuk reliabilitas ekuivalensi yang direncanakan terjadi dalam
waktu yang sama. Oleh karena itu, analisis diatas dapat dikatakan sebagai
reliabilitas atau konsistensi internal. Oleh karena reliabilitas yang
digambarkan baru separo dari tes sebenarnya maka formula koreksi perlu
digunakan untuk meningkatkan ketepatan perhitungan tingkat konsistensi. Formula
koreksi yang digunakan adalah menggunakan korelasi Spearman-Brown yang dapat
dilihat sebagai berikut.
rtotal tes =
Contoh penggunan rumus adalah missal
dari hasil tes diketahui koefisien reliabilitas yang terdiri atas 50 item
adalah 0,80. Harga ini menjadi dasar korelasi antara 25 item ganjil dan 25 item
genap. Jika formula Spearman-Brown digunakan maka:
rtotal tes = = = 0,89
G.
Faktor-faktor
yang mempengaruhi Reliabilitas
Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu
penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang
juga mempengaruhi reliabilitas instrumen evaluasi diantaranya sebagai berikut:
1.
Panjang
tes; semakin panjang suatu tes evaluasi,semakin banyak jumlah item materi pembelajaran
diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin mendekati
kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak. Berarti
akan semakin tinggi nilai koefisien reliabilitas.
2.
Penyebaran
skor; koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran
skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi
estimasi koefisien reliabilitas (Gronlund 1990: 94).
3.
Kesulitan
tes; tes normatif yang terlalu mudah atau terlalu sulit untuk siswa, cenderung
menghasilkan skor reliabilitas rendah.
4.
Obyektivitas:
yang dimaksud dengan obyektif yaitu derajat dimana siswa dengan kompetensi
sama, mencapai hasil sama. Ketika prosedur evaluasi memiliki obyektivitas
tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik
penskoran.[25]
BAB III
PENUTUP
A.
Kesimpulan
Ø Validitas (kesahihan) adalah kualitas yang menunjukkan hubungan
antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar
atau tingkah laku.
Ø Macam-macam Validitas: Validitas isi, Validitas Konstruk, Validitas
Konkuren dan Validitas Prediksi.
Ø Cara menghitung Validitas alat ukur yaitu dengan korelasi product
moment.
Ø Faktor-faktor yang mempengaruhi validitas: Faktor yang berasal dari
dalam tes, Faktor yang berasal dari administrasi dan skor, Faktor-faktor yang berasal dari jawaban siswa.
Ø Reliabilitas (keandalan) adalah ketetapan atau ketelitian suatu
alat evaluasi. Suatu tes dapat dikatakan andal jika ia dapat dipercaya,
konsisten, atau stabil dan produktif.
Ø Cara-cara mencari besarnya reliabilitas: Metode bentuk paralel (equivalent),
Metode tes ulang (tes-retest method) dan Metode belah dua (split-half
method).
Ø Faktor-faktor mempengaruhi reliabilitas instrument evaluasi
diantaranya sebagai berikut: Panjang tes, Penyebaran skor, Kesulitan tes dan Obyektivitas.
[1]
Zainal Arifin. Evaluasi pembelajaran. Prinsip, Teknik dan Prosedur,
(Bandung: PT Remaja Rosdakarya, 2011), 246-247.
[2]
Saifuddin Azwar. Tes Prestasi, Fungsi Pengembangan Pengukuran
Prestasi Belajar, (Yogyakarta:
Pustaka Pelajar), 173.
[3] M.
Ngalim Purwanto. Prinsip-prinsip dan Teknik Evaluasi Pengajaran,
(Bandung: PT Remaja Rosdakarya, 2008), 137-138.
[4]
Harjanto. Perencanaan Pengajaran, (Jakarta: PT Rineka Cipta, 1997), 288
[5]
Zainal Arifin. Evaluasi…, 248.
[6]
Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya, (Jakarta: PT
Bumi Aksara, 2009), 32.
[7] Ibid.,
32-33.
[8] Ibid.,
33-34.
[9]
Sukardi. Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya,
(Jakarta: PT Bumi Aksara, 2009), 124.
[10]
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi
Aksara, 2009), 68.
[11]
Sukardi. Metodologi…, 124.
[12] Ibid.,
125-126.
[13]
Zainal Mustafa EQ. Mengurai Variabel hingga Instrumentasi. (Yogyakarta:
Graha Ilmu), 166.
[14]
Suharsimi Arikunto, Dasar-dasar …, 69-75.
[15]
Sukardi. Evaluasi…, 38-39.
[16]
M. Ngalim Purwanto. Prinsip-prinsip…, 139.
[17]
Nana Sudjana. Penilaian Hasil Proses Belajar Mengajar, (Bandung: PT
Remaja Rosdakarya, 2009), 149.
[18]
Asep Jihad dan Abdul Haris. Evaluasi Pembelajaran, (Yogyakarta: Multi
Pressindo, 2010), 180.
[19]
Suharsimi Arikunto, Dasar-dasar…, 90.
[20]
Sukardi. Metodologi…, 130.
[21]
Zainal Mustafa EQ. Mengurai Zainal Mustafa EQ. Mengurai…, 181.
[22] Zainal
Arifin. Evaluasi…, 259.
[23]
Sukardi. Metodologi…, 128.
[24] Ibid.,
130-131.
[25]
Sukardi. Evaluasi…, 51-52.
DAFTAR PUSTAKA
Arifin, Zainal. Evaluasi Pembelajaran,
prinsip, teknik dan prosedur. Bandung: PT Remaja Rosdakarya, 2011.
Arikunto, Suharsimi. Dasar-dasar Evaluasi Pendidikan.
Jakarta: PT Bumi Aksara, 2009.
Azwar, Saifuddin. Tes Prestasi, Fungsi Pengembangan
Pengukuran Prestasi Belajar,
Yogyakarta: Pustaka Pelajar.
Harjanto. Perencanaan Pengajaran, Jakarta: PT Rineka Cipta,
1997.
Jihad, Asep dan Haris, Abdul. Evaluasi
Pembelajaran. Jakarta: Multi Pressindo, 2010.
Mustafa EQ, Zainal. Mengurai Variabel hingga Instrumentasi.
Yogyakarta: Graha Ilmu.
Purwanto, M. Ngalim. Prinsip-prinsip dan Teknik Evaluasi
Pengajaran. Bandung: PT Remaja Rosdakarya, 2008.
Sudjana, Nana. Penilaian Hasil Proses Belajar Mengajar.
Bandung: PT Remaja Rosdakarya, 2009.
Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya.
Jakarta: PT Bumi Aksara, 2009.
Sukardi. Metodologi
Penelitian Pendidikan, Kompetensi dan Praktiknya. Jakarta: PT Bumi Aksara,
2009.
VALIDITAS
DAN RELIABILITAS
makalah ini
diajukan untuk memenuhi salah satu tugas matakuliah
“MODEL PENILAIAN KELAS”
Disusun oleh:
Siang Suryaningtias 210311150
Dosen pengampu:
Drs. Ju’ Subaidi.
M.Ag
JURUSAN TARBIYAH
PROGRAM STUDI
PENDIDIKAN AGAMA ISLAM
SEKOLAH TINGGI AGAMA
ISLAM NEGERI
(STAIN) PONOROGO
DESEMBER 2013
BAB I
PENDAHULUAN
A.
Latar
Belakang Masalah
Dalam kegiatan penelitian untuk memperoleh data yang berasal dari
lapangan, seorang peneliti biasanya menggunakan instrument yang baik dan mampu
mengambil informasi dari objek atau subjek yang diteliti. Untuk mencapai tujuan
tersebut seorang peneliti dapat membuat instrumen tersebut. Di bidang
pendidikan dan tingkah laku, instrument penelitian pada umumnya perlu mempunyai
dua syarat penting, yaitu valid dan reliabel.[1]
Dalam makalah ini akan dijelaskan mengenai dua syarat penting tersebut.
B.
Rumusan
Masalah
1.
Apa
Pengertian Validitas?
2.
Apa
Saja Tipe Validitas?
3.
Bagaimana
Cara Menghitung Validitas?
4.
Apa
Saja Faktor-faktor yang Mempengaruhi Validitas?
5.
Apa
Pengertian Reliabilitas?
6.
Bagaimana
Cara-cara Menghitung Reliabilitas?
7.
Apa
Saja Faktor-faktor yang Mempengaruhi Reliabilitas?
BAB II
PEMBAHASAN
A.
Pengertian
Validitas
Valid, menurut Gronlund (1985) dapat diartikan sebagai ketepatan
interpretasi yang dihasilkan dari skor tes atau instrument evaluasi.[2] Analisis
validitas bertujuan mengkaji kesahihan alat ukur atau soal dalam menilai apa
yang seharusnya diukur atau mengkaji ketepatan soal tes sebagai alat ukur.[3] Di
dalam proses penyusunan desain instruksional secara sistematis, validasi
merupakan langkah terakhir.[4]
Validitas suatu instrumen evaluasi tidak lain adalah derajat yang
menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu
instrumen evaluasi mempunyai beberapa makna penting diantaranya seperti
berikut.
1.
Validitas
berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi
untuk grup individual dan bukan instrumen itu sendiri.
2.
Validitas
diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori
rendah, menengah, dan tinggi.
3.
Prinsip
suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan
oleh para peneliti adalah bahwa ia hanya valid untuk tujuan tertentu saja. Tes
valid untuk bidang studi metrologi industri belum tentu valid untuk bidang yang
lain misalnya midang mekanika teknik.[5]
B.
Tipe
Validitas
Tipe validitas terbagi atas Validitas Isi (content),
Validitas Konstrak (construct), dan Validitas Berdasar Kriteria (criterion-related).
Validitas berdasar kriteria terbagi lagi atas tipe Validitas Konkuren (concurrent)
dan Validitas Prediktif (predictive).[6]
1.
Validitas
Isi
Validitas Isi berkaitan dengan
pertanyaan mengenai seberapa lengkap butir-butir yang digunakan telah memadai
atau dapat mengungkap sebuah konsep.[7] Sebuah
tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu
yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena
materi yang diajarkan tertera dalam kurikulum maka validitas isi sering juga
disebut validitas kurikuler.[8]
Validitas isi juga mempunyai peran
yang sangat penting untuk tes pencapaian hasil belajar. Validitas isi pada
umumnya ditentukan melalui pertimbangan para ahli. Tidak ada formula matematis
untuk menghitung dan tidak ada cara untuk menunjukkannya secara pasti. Akan
tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi dengan
menggunakan validitas isi, pertimbangan para ahli tersebut dilakukan dengan
cara seperti berikut. Pertama, para ahli diminta untuk mengamati secara cermat
semua item dalam tes yang hendak divalidasi. Kemudian mereka diminta untuk
mengoreksi interpretasi item-item yang telah dibuat. Pada akhir perbaikan,
mereka juga diminta untuk memberikan pertimbangan tentang bagaimnana baik
interpretasi tes evaluasi tersebut menggambarkan cakupan isi yang hendak
diukur.[9]
2.
Validitas
Konstrak
Untuk menentukan adanya validitas
konstrak, suatu tes dikorelasikan dengan suatu konsepsi atau teori. Items
dalam tes itu harus sesuai dengan ciri-ciri yang disebutkan dalam konsepsi
tadi. Yaitu konsepsi tentang obyek yang akan dites. Dengan kata lain, hasil tes
itu disesuaikan dengan tujuan atau ciri-ciri tingkah laku (domein) yang hendak
diukur.[10]
Proses melakukan validasi konstrak
dapat dilakukan dengan cara melibatkan hipotesis testing yang dideduksi dari
teori yang menyangkut dengan konstrak yang relevan. Misalnya jika suatu teori
kecemasan menyatakan bahwa seseorang yang memiliki kecemasan lebih tinggi akan
bekerja lebih lama dalam menyelesaikan suatu masalah, dibanding orang yang memiliki
tingkat kecemasan rendah.[11]
3.
Validitas
Konkuren
Validitas konkuren adalah derajat
dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat.
Validitas konkuren ditentukan dengan
membangun analisis hubungan atau pembedaan. Cara-cara membuat tes dengan
validitas konkuren dapat dilakukan dengan beberapa langkah sebagai berikut.
a.
Administrasikan
tes yang baru dilakukan terhadap grup atau anggota kelompok.
b.
Catat
tes baku yang ada termasuk beberapa koefisien validitasnya jika ada.
c.
Hubungkan
atau korelasikan dua tes skor tersebut.
Hasil yang dicapai atau koefisien
validitas yang muncul menunjukkan derajat hubungan validitas tes yang baru.
Jika koefisien tinggi, berarti tes yang baru tersebut mempunyai validitas
konkuren baik. Sebaliknya tes yang baru dikatakan mempunyai validitas konkuren
jelek, jika koefisien yang dihasilkan rendah.[12]
4.
Validitas
Prediktif
Validitas prediksi adalah derajat
yang menunjukkan suatu tes dapat meprediksi tentang bagiamana seseorang akan
melakukan suatu prospek tugas atau pekerjaan yang direncanakan.
Dalam membuat validasi prediksi,
suatu tes biasanya mempunyai sekuensi sebagai berikut. Pertama,
mengidentifikasi dan mendefinisikan secara teliti criterion yang hendak
diinginkan. Kriteria yang terpilih harus mengukur validitas terhadap tingkah
laku yang diprediksi. Ketika kriteria telah diidentifikasi dan ditentukan,
prosedur selanjutnya adalah menentukan validitas prediksi suatu tes.[13]
Validitas ini dimaksudkan agar hasil
tes mampu memprediksi keberhasilan peserta didik di kemudian hari, misalnya
ujian masuk atau tes seleksi.[14]
C.
Cara
menghitung Validitas
Sebuah tes
dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti
memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang
digunakan untuk mengatuhi kesejajaran adalah teknik korelasi product moment
yang dikemukakakan oleh Pearson.
Rumus korelasi product
moment ada dua macam, yaitu:
a.
Korelasi
product moment dengan simpangan.
Rumus korelasi product moment dengan simpangan:
rxy =
dimana:
rxy = koefisien korelasi antara variabel X dan variabel
Y, dua variabel yang dikorelasikan (x = X- dan y = Y- ).
= jumlah perkalian x dan y
x2 = kuadrat
dari x
y2 = kuadrat dari y
b.
Korelasi
product moment dengan angka kasar.
Rumus korelasi product moment dengan angka kasar:
RXY = [15]
Validitas suatu tes dinyatakan dengan angka korelasi koefisien (r).
kriteria korelasi koefisien adalah sebagai berikut:
ü 0,00 – 0,20 sangat rendah (hamper tidak ada korelasi)
ü 0,20 – 0,40 korelasi rendah
ü 0,40 – 0,70 korelasi cukup
ü 0,70 – 0,90 korelasi tinggi
ü 0,90 – 1,00 korelasi sangat tinggi.[16]
Penafsiran harga koefisien korelasi
ada dua cara yaitu:
1.
Dengan
melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup dan
sebagainya.
2.
Dengan
berkonsultasi ke tabel harga kritik r product moment sehingga dapat
diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari
harga kritik tabel, maka korelasi tersebut tidak signifikan. Begitu juga arti
sebaliknya.[17]
D.
Faktor-faktor
yang mempengaruhi validitas
1.
Faktor
yang berasal dari dalam tes
a.
Arahan
tes yang disusun dengan makna yang tidak jelas sehingga dapat mengurangi
validitas tes.
b.
Kata-kata
yang digunakan dalam struktur instrumen evaluasi, terlalu sulit.
c.
Item-item
tes dikontruksi dengan jelek.
d.
Tingkat
kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e.
Waktu
yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau
terlalu longgar.
f.
Jumlah
item terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran.
g.
Jawaban
masing-masing item evaluasi bisa diprediksi siswa.
2.
Faktor
yang berasal dari administrasi dan skor. Faktor ini dapat mengurangi validitas interpretasi
tes evaluasi, khususnya tes evaluasi yang dibuat oleh guru. Berikut beberapa
contoh faktor yang sumbernya berasal dari proses administrasi dan skor.
a.
Waktu
pengajaran tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi
yang tergesa-gesa.
b.
Adanya
kecurangan dalam tes sehingga tidak bisa membedakan antara siswa yang belajar
dengan yang melakukan kecurangan.
c.
Pemberian
petunjuk dari pengawas yang tidak dapat dilakukan pada semua siswa.
d.
Teknik
pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat
mengurangi validitas tes evaluasi.
e.
Siswa
tidak dapat mengikuti arahan yang diberikan dalam tes baku.
f.
Adanya
joki (orang lain bukan siswa) yang masuk dan menjawab item tes yang diberikan.
3.
Faktor-faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa
interpretasi terhadap item-item evaluasi tidak valid, karena dipengaruhi oleh
jawaban siswa daripada interpretasi item-item pada tes evaluasi. Sebagai
contoh, sebelum tes para siswa menjadi tegang karena guru pengampu mata pelajaran
dikenal “killer”, galak dan sebagainya sehingga siswa yang ikut tes banyak yang
gagal.[18]
E.
Pengertian
Reliabilitas
Reliabilitas adalah tingkat atau derajat konsistensi dari suatu
instrumen. Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes
teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu
tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila
diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.[19]
Tidak reliabel suatu tes pada prinsipnya dikatakan juga sia-sia tes
tersebut karena jika dilakukan pengetesan kembali hasilnya akan berbeda.
Reliabilitas tes pada umumnya diekspresikan secara numerik dalam bentuk
koefisien. Koefisien tinggi menunjukkan reliabilitas tinggi. Sebaliknya jika
koefisien suatu tes rendah maka reliabilitas rendah.[20]
F.
Cara-cara
menghitung Reliabilitas
Menurut perhitungan product moment dari Pearson, ada tiga
macam reliabilitas, yaitu koefisisen stabilitas, koefisien ekuivalen, dan
koefisien konsistensi internal.
1.
Koefisisen
Stabilitas
Koefisien stabilitas adalah jenis
reliabilitas yang menggunakan teknik tes dan retest, yaitu memberikan tes
kepada sekelompok individu, kemudian diadakan pengulangan tes pada kelompok
yang sama dengan waktu yang berbeda.
Cara memperoleh koefisien stabilitas
adalah dengan mengorelasikan hasil tes pertama dengan hasil tes kedua dari
kelompok yang sama, tes yang sama, pada waktu yang berbeda.
2.
Koefisien
ekuivalen
Koefisien ekuivalen adalah jika
mengorelasikan dua buah tes yang paralel pada kelompok dan waktu yang sama.
Metode yang digunakan untuk memperoleh koefisien ekuivalen adalah dengan
menggunakan dua buah tes yang paralel. Syarat-syarat yang harus dipenuhi kedua
tes paralel adalah krieria yang dipakai pada kedua tes sama, masing-masing tes
dikontruksikan tersendiri, jumlah item, isi dan corak sama, tingkat kesukaran
sama, petunjuk waktu yang disediakan untuk mengerjakan tes, dan contoh-contoh
juga sama. Kemungkinan kesalahan pada teknik ini bersumber dari derajat
keseimbangan antara dua tes tersebut, serta kondisi tempat yang mungkin berbeda
pada kelompok tes pertama dengan kelompok tes kedua, meskipun dilakukan pada
waktu yang sama.
3.
Koefisien
Konsistensi Internal (belah dua)
Koefisien konsistensi internal
adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari
kelompok yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk
tes yang pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik
ini sering juga disebut split-half method. Split berarti membelah
dan half berarti setengah atau separuh. Jadi split-half adalah
tes yang dibagi menjadi dua bagian yang sama, kemudian mengorelasikan butir
soal yang bernomor ganjil dalam belahan pertama (X) dan yang bernomor genap
dalam belahan kedua (Y). Untuk membagi tes menjadi dua bagian dapat juga
dilakukan dengan jalan megambil nomor soal secara acak, tetapi jumlahnya tetap
harus sama untuk masing-masing kelompok. Disamping itu, pembagian tes dapat
juga dilakukan dengan cara setengah bagian pertama untuk kelompok pertama dan
setengah lagi untuk kelompok kedua.[21]
Jika hasil koefisien korelasi tinggi
maka tes mempunyai tingkat reliabilitas baik. Akan dapat diartikan sebaliknya
jika hasil korelasi belah dua item ternyata rendah. Perlu diingat bahwa dari
analisis belah dua diatas, hasil korelasi yang muncul baru separo. Sebenarnya
apa yang kita kerjakan adalah menciptakan secara artifisial dua macam kelompok
ekuivalen dan menghitung bentuk reliabilitas ekuivalensi yang direncanakan
terjadi dalam waktu yang sama. Oleh karena itu, analisis diatas dapat dikatakan
sebagai reliabilitas atau konsistensi internal. Oleh karena reliabilitas yang
digambarkan baru separo dari tes sebenarnya maka formula koreksi perlu
digunakan untuk meningkatkan ketepatan perhitungan tingkat konsistensi. Formula
koreksi yang digunakan adalah menggunakan korelasi Spearman-Brown yang dapat
dilihat sebagai berikut.
rtotal tes =
Contoh penggunan rumus adalah misal
dari hasil tes diketahui koefisien reliabilitas yang terdiri atas 50 item
adalah 0,80. Harga ini menjadi dasar korelasi antara 25 item ganjil dan 25 item
genap. Jika formula Spearman-Brown digunakan maka:
rtotal tes = = = 0,89
G.
Faktor-faktor
yang mempengaruhi Reliabilitas
Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu
penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang
juga mempengaruhi reliabilitas instrument evaluasi diantaranya sebagai berikut:
1.
Panjang
tes; semakin panjang suatu tes evaluasi,semakin banyak jumlah item materi
pembelajaran diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin
mendekati kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak.
Berarti akan semakin tinggi nilai koefisien reliabilitas.
2.
Penyebaran
skor; koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran
skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi
estimasi koefisien reliabilitas (Gronlund 1990: 94).
3.
Kesulitan
tes; tes normatif yang terlalu mudah atau terlalu sulit untuk siswa, cenderug
menghasilkan skor reliabilitas rendah.
4.
Obyektivitas:
yang dimaksud dengan obyektif yaitu derajat dimana siswa dengan kompetensi
sama, mencapai hasil sama. Ketika prosedur evaluasi memiliki obyektivitas
tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik
penskoran.[23]
BAB III
PENUTUP
A.
Kesimpulan
ü Valid, menurut Gronlund (1985) dapat diartikan sebagai ketepatan
interpretasi yang dihasilkan dari skor tes atau instrument evaluasi.
ü Tipe validitas terbagi atas Validitas Isi (content),
Validitas Konstrak (construct), dan Validitas Berdasar Kriteria (criterion-related).
Validitas berdasar criteria terbagi lagi atas tipe Validitas Konkuren (concurrent)
dan Validitas Prediktif (predictive).
ü Cara menghitung validitas yaitu dengan teknik korelasi product
moment.
ü Faktor-faktor yang mempengaruhi validitas: Faktor yang berasal dari
dalam tes, Faktor yang berasal dari administrasi dan skor, Faktor-faktor yang berasal dari jawaban siswa.
ü Reliabilitas adalah tingkat atau derajat konsistensi dari suatu
instrumen.
ü Cara-cara menghitung Reliabilitas: Koefisisen Stabilitas, Koefisien
ekuivalen, Koefisien Konsistensensi Internal (belah dua).
ü Factor-faktor mempengaruhi reliabilitas instrumen evaluasi
diantaranya sebagai berikut: Panjang tes, Penyebaran skor, Kesulitan tes dan Obyektivitas.
[1]
Sukardi. Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya,
(Jakarta: PT Bumi Aksara, 2009), 121.
[2]
Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya, (Jakarta: PT
Bumi Aksara, 2009), 30.
[3] Nana
Sudjana. Penilaian Hasil Proses Belajar Mengajar, (Bandung: PT Remaja
Rosdakarya, 2009), 149.
[4]
Harjanto. Perencanaan Pengajaran, (Jakarta: PT Rineka Cipta, 1997), 288.
[5]
Sukardi. Evaluasi …,31.
[6]
Saifuddin Azwar. Tes Prestasi, Fungsi Pengembangan Pengukuran
Prestasi Belajar, (Yogyakarta:
Pustaka Pelajar), 175.
[7] Zainal
Mustafa EQ. Mengurai Variabel hingga Instrumentasi. (Yogyakarta: Graha
Ilmu), 165.
[8]
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi
Aksara, 2009), 67.
[9] Ibid.,
32-33.
[10]
M. Ngalim Purwanto. Prinsip-prinsip dan Teknik Evaluasi Pengajaran,
(Bandung: PT Remaja Rosdakarya, 2008), 138.
[11] Ibid.,
33-34.
[12]
Sukardi. Metodologi…, 124.
[13] Ibid.,
125-126.
[14]
Asep Jihad dan Abdul Haris. Evaluasi Pembelajaran, (Yogyakarta: Multi
Pressindo, 2010), 179.
[15]
Suharsimi Arikunto, Dasar-dasar …, 69-75.
[16]
M. Ngalim Purwanto. Prinsip-prinsip…, 139.
[17]
Suharsimi Arikunto, Dasar-dasar …, 75.
[18]
Sukardi. Evaluasi…, 38-39.
[19]
Zainal Arifin. Evaluasi pembelajaran. Prinsip, Teknik dan Prosedur,
(Bandung: PT Remaja Rosdakarya, 2011), 258.
[20]
Sukardi. Metodologi…, 128.
[21]
Zainal Arifin. Evaluasi …, 259-261.
[22]
Sukardi. Evaluasi…, 48.
[23]
Sukardi. Evaluasi…, 51-52.
DAFTAR PUSTAKA
Arifin, Zainal. Evaluasi Pembelajaran,
prinsip, teknik dan prosedur. Bandung: PT Remaja Rosdakarya, 2011.
Arikunto, Suharsimi. Dasar-dasar Evaluasi Pendidikan.
Jakarta: PT Bumi Aksara, 2009.
Azwar, Saifuddin. Tes Prestasi, Fungsi Pengembangan
Pengukuran Prestasi Belajar,
Yogyakarta: Pustaka Pelajar.
Harjanto. Perencanaan Pengajaran, Jakarta: PT Rineka Cipta,
1997.
Jihad, Asep dan Haris, Abdul. Evaluasi
Pembelajaran. Jakarta: Multi Pressindo, 2010.
Mustafa EQ, Zainal. Mengurai Variabel hingga Instrumentasi.
Yogyakarta: Graha Ilmu.
Purwanto, M. Ngalim. Prinsip-prinsip dan Teknik Evaluasi
Pengajaran. Bandung: PT Remaja Rosdakarya, 2008.
Sudjana, Nana. Penilaian Hasil Proses Belajar Mengajar.
Bandung: PT Remaja Rosdakarya, 2009.
Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya.
Jakarta: PT Bumi Aksara, 2009.
Sukardi. Metodologi
Penelitian Pendidikan, Kompetensi dan Praktiknya. Jakarta: PT Bumi Aksara,
2009.
Tidak ada komentar:
Posting Komentar