Rabu, 28 Oktober 2015

smt 5 mpk validitas dan reliabilitas

VALIDITAS DAN RELIABILITAS
makalah ini diajukan untuk memenuhi salah satu tugas matakuliah
MODEL PENILAIAN KELAS



 













Disusun oleh:
Qurriyatul Munawwaroh                 210311149



Dosen pengampu:
Drs. Ju’ Subaidi. M.Ag


JURUSAN TARBIYAH
PROGRAM STUDI PENDIDIKAN AGAMA ISLAM
SEKOLAH TINGGI AGAMA ISLAM NEGERI
(STAIN) PONOROGO
DESEMBER 2013


 BAB I
PENDAHULUAN
A.    Latar Belakang Masalah
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Dalam penilaian hasil belajar, tes diharapkan dapat menggambarkan sampel perilaku dan menghasilkan nilai yang obyektif dan akurat.
Dalam praktik evaluasi di sekolah, sering kali guru acuh tak acuh dengan kualitas suatu tes. Artinya, apakah suatu tes termasuk baik atau tidak, guru tidak mau tahu, yang penting bagi guru adalah tersedianya perangkat tes untuk melaksanakan penilaian.[1]
Analisis kualitas tes menunjuk pada dua hal pokok, yaitu validitas dan reliabilitas. Kedua hal ini sekaligus merupakan karakteristik alat ukur yang baik. Dalam makalah ini akan dijelaskan mengenai validitas dan reliabilitas.
B.     Rumusan Masalah
1.      Apa Pengertian Validitas?
2.      Apa Saja Macam-macam Validitas?
3.      Bagaimana Cara Menghitung Validitas?
4.      Apa Saja Faktor-faktor yang Mempengaruhi Validitas?
5.      Apa Pengertian Reliabilitas?
6.      Bagaimana Cara-cara Mencari Besarnya Reliabilitas?
7.      Apa Saja Faktor-faktor yang Mempengaruhi Reliabilitas?


BAB II
PEMBAHASAN
A.    Pengertian Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya.[2] Validitas (kesahihan) adalah kualitas yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku. Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut valid) jika teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur.[3]
Sebelum digunakan dalam kegiatan belajar mengajar, hendaknya paket pengajaran telah mempunyai status “valid”. Untuk dapat mencapai validitas ini, paket pengajaran tersebut perlu melalui proses tryout atau uji coba.[4]
Selanjutnya, Kerlinger (1986) mengemukakan, “validitas instrumen tidak cukup ditentuikan oleh derajat ketepatan instrumen untuk mengukur apa yang seharusnya dapat diukur, tetapi perlu juga dilihat dari tiga kriteria yang lain, yaitu appropriatness, meaningfullness, dan usefullness.” Appropriatness menunjukkan kelayakan dari tes sebagai suatu instrumen, yaitu seberapa jauh instrumen dapat menjangkau keragaman aspek perilaku peserta didik. Meaningfullness menunjukkan kemampuan instrumen dalam memberikan keseimbangan soal-soal pengukurannya berdasar tingkat kepentingan dari setiap fenomena. Usefullness to inferences menunjukkan sensitif tidaknya instrumen dalam menangkap fenomena perilaku dan tingkat ketelitian yang ditunjukkan dalam membuat kesimpulan.[5]
B.     Macam-macam Validitas
Dalam evaluasi pendidikan, validitas suatu tes dapat dibedakan menjadi empat macam, yaitu validitas isi, validitas konstruk, validitas konkuren, dan prediksi yang akan diuraikan dengan lebih jelas seperti berikut.[6]

1.      Validitas Isi
Yang dimaksud validitas isi ialah derajat dimana sebuah tes evaluasi mengukur cakupan substansi yang ingin diukur. Untuk mendapatkan validitas isi memerlukan dua aspek penting, yaitu valid isi dan valid teknik sampling. Valid isi mencakup khususnya hal-hal yang berkaitan dengan apakah tem-item evaluasi menggambarkan pengukuran dalam cakupan yang inging diukur. Sedangkan validitas teknik sampling pada umumnya berkaitan dengan bagaimanakah baiknya suatu sampel item tes mempresentasikan total cakupan isi.
Validitas isi juga mempunyai peran yang sangat penting untuk tes pencapaian hasil belajar. Validitas isi pada umumnya ditentukan melalui pertimbangan para ahli. Tidak ada formula matematis untuk menghitung dan tidak ada cara untuk menunjukkannya secara pasti. Akan tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi dengan menggunakan validitas isi, pertimbangan para ahli tersebut dilakukan dengan cara seperti berikut.
Pertama, para ahli diminta untuk mengamati secara cermat semua item dalam tes yang hendak divalidasi. Kemudian mereka diminta untuk mengoreksi interpretasi item-item yang telah dibuat. Pada akhir perbaikan, mereka juga diminta untuk memberikan pertimbangan tentang bagaimnana baik interpretasi tes evaluasi tersebut menggambarkan cakupan isi yang hendak diukur.[7]
2.      Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara. Konstruk secara definitif, merupakan suatu sifat yang tidak dapat diobservasi, tetapi kita dapat merasakan pengaruhnya melalui satu atau dua indra kita. Dalam dunia pendidikan, contoh yang menyangkut konstruk, misalnya ketakutan, kreativitas, semangat, dan sebagainya.
Proses melakukan validasi konstruk dapat dilakukan dengan cara melibatkan hipotesis testing yang dideduksi dari teori yang menyangkut dengan konstruk yang relevan. Misalnya jika suatu teori kecemasan menyatakan bahwa seseorang yang memiliki kecemasan lebih tinggi akan bekerja lebih lama dalam menyelesaikan suatu masalah, dibanding orang yang memiliki tingkat kecemasan rendah.[8]
3.      Validitas Konkuren
Validitas konkuren adalah derajat dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat.[9] Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman.[10] Validitas konkuren ditentukan  dengan membangun analisis hubungan atau pembedaan. Cara-cara membuat tes dengan validitas konkuren dapat dilakukan dengan beberapa langkah sebagai berikut.
a.       Administrasikan tes yang baru dilakukan terhadap grup atau anggota kelompok.
b.      Catat tes baku yang ada termasuk beberapa koefisien validitasnya jika ada.
c.       Hubungkan atau korelasikan dua tes skor tersebut.
Hasil yang dicapai atau koefisien validitas yang muncul menunjukkan derajat hubungan validitas tes yang baru. Jika koefisien tinggi, berarti tes yang baru tersebut mempunyai validitas konkuren baik. Sebaliknya tes yang baru dikatakan mempunyai validitas konkuren jelek, jika koefisien yang dihasilkan rendah.[11]
4.      Validitas Prediksi
Validitas prediksi adalah derajat yang menunjukkan suatu tes dapat memprediksi tentang bagiamana seseorang akan melakukan suatu prospek tugas atau pekerjaan yang direncanakan.
Validitas prediksi suatu tes pada umumnya ditentukan dengan membangun hubungan antara skor tes dan beberapa ukuran keberhasilan dalam situasi tertentu yang digunakan untuk memprediksi keberhasilan, yang selanjutnya disebut sebagai predictor. Sedangkan tingkah laku yang hendak diprediksi pada umumnya disebut sebagai criterion.
Dalam membuat validasi prediksi, suatu tes biasanya mempunyai sekuensi sebagai berikut. Pertama, mengidentifikasi dan mendefinisikan secara teliti criterion yang hendak diinginkan. Kriteria yang terpilih harus mengukur validitas terhadap tingkah laku yang diprediksi. Ketika kriteria telah diidentifikasi dan ditentukan, prosedur selanjutnya adalah menentukan validitas prediksi suatu tes.[12] Suatu butir dinyatakan mempunyai validitas prediktif yang tinggi apabila butir tersebut mampu memberikan nilai berbeda untuk individu yang berbeda berdasarkan kriteria yang diprediksikan untuk masa mendatang.[13]
C.     Cara menghitung Validitas alat ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengatuhi kesejajaran adalah teknik korelasi product moment yang dikemukakakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a.       Korelasi product moment dengan simpangan.
Rumus korelasi product moment dengan simpangan:
rxy =   
dimana:
rxy = koefisien krelasi antara variabel X dan variabel Y, dua variabel yang dikorelasikan (x = X-  dan y = Y- ).
 = jumlah perkalian x dan y
x2     = kuadrat dari x
y2    = kuadrat dari y
b.      Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan angka kasar:
RXY =

Koefisien korelasi selalu terdapat antara -1,00 sampai = 1,00. Namun karena dalam menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh koefisien lebih dari 1,00. Koefisien negatif menunjukkan hubungan kebalikan sedangkan koefisien positif menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai besarnya koefisien korelasi adalah sebagai berikut:
Ø  Antara 0,800 sampai dengan 1,00      : sangat tinggi
Ø  Antara 0,600 sampai dengan 0,800    : tinggi
Ø  Antara 0,400 sampai dengan 0,600    : cukup
Ø  Antara 0,200 sampai dengan 0,400    : rendah
Ø  Antara 0,00 sampai dengan 0,200      : sangat rendah
Penafsiran harga koefisien korelasi ada dua cara yaitu:
1.      Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup dan sebagainya.
2.      Dengan berkonsultasi ke tabel harga kritik r product moment sehingga dapat diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik tabel, maka korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.[14]
D.    Faktor-faktor yang Mempengaruhi Validitas
1.      Faktor yang berasal dari dalam tes
a.       Arahan tes yang disusun dengan makna yang tidak jelas sehingga dapat mengurangi validitas tes.
b.      Kata-kata yang digunakan dalam strukutur instrument evaluasi, terlalu sulit.
c.       Item-item tes dikontruksi dengan jelek.
d.      Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e.       Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
f.       Jumlah item terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran.
g.      Jawaban masing-masing item evaluasi bisa diprediksi siswa.
2.      Faktor yang berasal dari administrasi dan skor. Faktor ini dapat mengurangi validitas interpretasi tes evaluasi, khususnya tes evaluasi yang dibuat oleh guru. Berikut beberapa contoh faktor yang sumbernya berasal dari proses administrasi dan skor.
a.       Waktu pengajaran tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi yang tergesa-gesa.
b.      Adanya kecurangan dalam tes sehingga tidak bisa membedakan antara siswa yang belajar dengan yang melakukan kecurangan.
c.       Pemberian petunjuk dari pengawas yang tidak dapat dilakukan pada semua siswa.
d.      Teknik pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat mengurangi validitas tes evaluasi.
e.       Siswa tidak dapat mengikuti arahan yang diberikan dalam tes baku.
f.       Adanya joki (orang lain bukan siswa) yang masuk dan menjawab item tes yang diberikan.
3.      Faktor-faktor  yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item evaluasi tidak valid, karena dipengaruhi oleh jawaban siswa daripada interpretasi item-item pada tes evaluasi. Sebagai contoh, sebelum tes para siswa menjadi tegang karena guru pengampu mata pelajaran dikenal “killer”, galak dan sebagainya sehingga siswa yang ikut tes banyak yang gagal.[15]
E.     Pengertian Reliabilitas
Reliabilitas (keandalan) adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu tes dapat dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Jadi, yang dipentingkan disini ialah ketelitiannya: sejauh mana tes atau alat tersebut dapat dipercaya kebenarannya.[16]
Reliabilitas mengkaji ke-ajegan (stability) atau ketetapan hasil tes manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali, atau dari dua perangkat tes yang setara kepada obyek yang sama.[17] Reliabilitas soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistensinan suatu soal tes.[18]
F.      Cara-cara mencari besarnya reliabilitas
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.[19]
1.      Metode bentuk paralel (equivalent)
Sesuai dengan namanya, yaitu ekuivalen maka tes yang hendak diukur reliabilitasnya dibuat identik. Setiap tampilannya, kecuali substansi item yang ada dapat berbeda. Kedua tes tersebut sebaiknya mempunyai karakteristik sama. Karakteristik yang dimaksud termasuk, misalnya mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara skoring, dan interpretasi yang sama.
Langkah-langkah melaksanakan tes reliabilitas diantaranya adalah sebagai berikut:
a.       Tentukan subyek sasaran yang hendak dites.
b.      Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
c.       Administrasikan hasilnya secara baik.
d.      Dalam waktu yang tidak terlalu lama, lakukan pengetesan untuk yang kedua kalinya pada grup tersebut.
e.       Korelaikan kedua hasil tes skor.
Jika hasil koefisien ekuivalen tinggi, berarti tes memiliki reliabilitas ekuialen baik. Sebaliknya apabila ternyata bahwa koefisien rendah maka reliabilitas ekuivalen rendah. Reliabilitas ekuivalen merupakan salah satu bentuk yang dapat diterima  dan umum dipakai dalam penelitian, terutama penelitian pendidikan.[20]
2.      Metode tes ulang (tes-retest method)
Metode ini menunjukkan konsistensi pengukuran dari waktu ke waktu dan menghasilkan koefisien reliabilitas yang sering disebut koefisien stabilitas.[21]
Koefisien stabilitas adalah jenis reliabilitas yang menggunakan teknik tes dan retest, yaitu memberikan tes kepada sekelompok individu, kemudian diadakan pengulangan tes pada kelompok yang sama dengan waktu yang berbeda.
Cara memperoleh koefisien stabilitas adalah dengan mengorelasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda.[22]
Jika hasil koefisien korelasi menunjukkan tinggi, berarti reliabilitas tes adalah bagus. Sebaliknya, jika korelasi rendah maka berarti bahwa tes tersebut mempunyai konsistensi rendah.[23]
3.      Metode belah dua (split-half method)
Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud dengan konsistensi internal ialah salah satu tipe reliabilitas yang didasarkan pada keajekan dalam tes. Reliabilitas belah dua ini pelaksanaannya hanya memerlukan waktu satu kali.
Cara melakukan reliabilitas belah dua pada garis besarnya dapat dilakukan dengan urutan sebagai berikut:
a.       Lakukan pengetesan item-item yang telah dibuat kepada subyek sasaran.
b.      Bagi tes yang ada menjadi dua atas dasar jumlah item yang paling umum dengan membagi ganjil dan genap pada kelompok tersebut.
c.       Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
d.      Korelasikan kedua skor tersebut , menggunakan formula korelasi yang relevan dengan teknik pengukuran.
Jika hasil koefisien korelasi tinggi maka tes mempunyai tingkat reliabilitas baik. Akan dapat diartikan sebaliknya jika hasil korelasi ternyata rendah.
Perlu diingat bahwa dari analisis belah dua diatas, hasil korelasi yang muncul baru separo. Sebenarnya apa yang kita kerjakan adalah menciptakan secara artifisial dua macam kelompok ekuivalen dan menghitung bentuk reliabilitas ekuivalensi yang direncanakan terjadi dalam waktu yang sama. Oleh karena itu, analisis diatas dapat dikatakan sebagai reliabilitas atau konsistensi internal. Oleh karena reliabilitas yang digambarkan baru separo dari tes sebenarnya maka formula koreksi perlu digunakan untuk meningkatkan ketepatan perhitungan tingkat konsistensi. Formula koreksi yang digunakan adalah menggunakan korelasi Spearman-Brown yang dapat dilihat sebagai berikut.
rtotal tes =
Contoh penggunan rumus adalah missal dari hasil tes diketahui koefisien reliabilitas yang terdiri atas 50 item adalah 0,80. Harga ini menjadi dasar korelasi antara 25 item ganjil dan 25 item genap. Jika formula Spearman-Brown digunakan maka:
rtotal tes =  =  = 0,89
Jadi rtotal tes setelah dikoreksi adalah 0,89.[24]

G.    Faktor-faktor yang mempengaruhi Reliabilitas
Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrumen evaluasi diantaranya sebagai berikut:
1.      Panjang tes; semakin panjang suatu tes evaluasi,semakin banyak jumlah item materi pembelajaran diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin mendekati kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak. Berarti akan semakin tinggi nilai koefisien reliabilitas.
2.      Penyebaran skor; koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas (Gronlund 1990: 94).
3.      Kesulitan tes; tes normatif yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah.
4.      Obyektivitas: yang dimaksud dengan obyektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur evaluasi memiliki obyektivitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik penskoran.[25]
BAB III
PENUTUP
A.    Kesimpulan
Ø  Validitas (kesahihan) adalah kualitas yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku.
Ø  Macam-macam Validitas: Validitas isi, Validitas Konstruk, Validitas Konkuren dan Validitas Prediksi.
Ø  Cara menghitung Validitas alat ukur yaitu dengan korelasi product moment.
Ø  Faktor-faktor yang mempengaruhi validitas: Faktor yang berasal dari dalam tes, Faktor yang berasal dari administrasi dan skor, Faktor-faktor  yang berasal dari jawaban siswa.
Ø  Reliabilitas (keandalan) adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu tes dapat dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif.
Ø  Cara-cara mencari besarnya reliabilitas: Metode bentuk paralel (equivalent), Metode tes ulang (tes-retest method) dan Metode belah dua (split-half method).
Ø  Faktor-faktor mempengaruhi reliabilitas instrument evaluasi diantaranya sebagai berikut: Panjang tes, Penyebaran skor, Kesulitan tes dan Obyektivitas.


[1] Zainal Arifin. Evaluasi pembelajaran. Prinsip, Teknik dan Prosedur, (Bandung: PT Remaja Rosdakarya, 2011), 246-247.
[2] Saifuddin Azwar. Tes Prestasi, Fungsi Pengembangan Pengukuran Prestasi Belajar,  (Yogyakarta: Pustaka Pelajar), 173.
[3] M. Ngalim Purwanto. Prinsip-prinsip dan Teknik Evaluasi Pengajaran, (Bandung: PT Remaja Rosdakarya, 2008), 137-138.
[4] Harjanto. Perencanaan Pengajaran, (Jakarta: PT Rineka Cipta, 1997), 288
[5] Zainal Arifin. Evaluasi…, 248.
[6] Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya, (Jakarta: PT Bumi Aksara, 2009), 32.
[7] Ibid., 32-33.
[8] Ibid., 33-34.
[9] Sukardi. Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya, (Jakarta: PT Bumi Aksara, 2009), 124.
[10] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi Aksara, 2009), 68.
[11] Sukardi. Metodologi…, 124.
[12] Ibid., 125-126.
[13] Zainal Mustafa EQ. Mengurai Variabel hingga Instrumentasi. (Yogyakarta: Graha Ilmu), 166.
[14] Suharsimi Arikunto, Dasar-dasar …, 69-75.
[15] Sukardi. Evaluasi…, 38-39.
[16] M. Ngalim Purwanto. Prinsip-prinsip…, 139.
[17] Nana Sudjana. Penilaian Hasil Proses Belajar Mengajar, (Bandung: PT Remaja Rosdakarya, 2009), 149.
[18] Asep Jihad dan Abdul Haris. Evaluasi Pembelajaran, (Yogyakarta: Multi Pressindo, 2010), 180.
[19] Suharsimi Arikunto, Dasar-dasar…, 90.
[20] Sukardi. Metodologi…, 130.
[21] Zainal Mustafa EQ. Mengurai Zainal Mustafa EQ. Mengurai…, 181.
[22] Zainal Arifin. Evaluasi…, 259.
[23] Sukardi. Metodologi…, 128.
[24] Ibid., 130-131.
[25] Sukardi. Evaluasi…, 51-52.
DAFTAR PUSTAKA

Arifin, Zainal. Evaluasi Pembelajaran, prinsip, teknik dan prosedur. Bandung: PT Remaja Rosdakarya, 2011.
Arikunto, Suharsimi. Dasar-dasar Evaluasi Pendidikan. Jakarta: PT Bumi Aksara, 2009.
Azwar, Saifuddin. Tes Prestasi, Fungsi Pengembangan Pengukuran Prestasi Belajar,  Yogyakarta: Pustaka Pelajar.
Harjanto. Perencanaan Pengajaran, Jakarta: PT Rineka Cipta, 1997.
Jihad, Asep dan Haris, Abdul. Evaluasi Pembelajaran. Jakarta: Multi Pressindo, 2010.
Mustafa EQ, Zainal. Mengurai Variabel hingga Instrumentasi. Yogyakarta: Graha Ilmu.
Purwanto, M. Ngalim. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: PT Remaja Rosdakarya, 2008.
Sudjana, Nana. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja Rosdakarya, 2009.
Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya. Jakarta: PT Bumi Aksara, 2009.

Sukardi.  Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya. Jakarta: PT Bumi Aksara, 2009.

VALIDITAS DAN RELIABILITAS
makalah ini diajukan untuk memenuhi salah satu tugas matakuliah
MODEL PENILAIAN KELAS



 












Disusun oleh:
Siang Suryaningtias              210311150



Dosen pengampu:
Drs. Ju’ Subaidi. M.Ag


JURUSAN TARBIYAH
PROGRAM STUDI PENDIDIKAN AGAMA ISLAM
SEKOLAH TINGGI AGAMA ISLAM NEGERI
(STAIN) PONOROGO
DESEMBER 2013

 BAB I
PENDAHULUAN
A.    Latar Belakang Masalah
Dalam kegiatan penelitian untuk memperoleh data yang berasal dari lapangan, seorang peneliti biasanya menggunakan instrument yang baik dan mampu mengambil informasi dari objek atau subjek yang diteliti. Untuk mencapai tujuan tersebut seorang peneliti dapat membuat instrumen tersebut. Di bidang pendidikan dan tingkah laku, instrument penelitian pada umumnya perlu mempunyai dua syarat penting, yaitu valid dan reliabel.[1] Dalam makalah ini akan dijelaskan mengenai dua syarat penting tersebut.
B.     Rumusan Masalah
1.      Apa Pengertian Validitas?
2.      Apa Saja Tipe Validitas?
3.      Bagaimana Cara Menghitung Validitas?
4.      Apa Saja Faktor-faktor yang Mempengaruhi Validitas?
5.      Apa Pengertian Reliabilitas?
6.      Bagaimana Cara-cara Menghitung Reliabilitas?
7.      Apa Saja Faktor-faktor yang Mempengaruhi Reliabilitas?
BAB II
PEMBAHASAN
A.    Pengertian Validitas
Valid, menurut Gronlund (1985) dapat diartikan sebagai ketepatan interpretasi yang dihasilkan dari skor tes atau instrument evaluasi.[2] Analisis validitas bertujuan mengkaji kesahihan alat ukur atau soal dalam menilai apa yang seharusnya diukur atau mengkaji ketepatan soal tes sebagai alat ukur.[3] Di dalam proses penyusunan desain instruksional secara sistematis, validasi merupakan langkah terakhir.[4]
Validitas suatu instrumen evaluasi tidak lain adalah derajat yang menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu instrumen evaluasi mempunyai beberapa makna penting diantaranya seperti berikut.
1.      Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi untuk grup individual dan bukan instrumen itu sendiri.
2.      Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori rendah, menengah, dan tinggi.
3.      Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk tujuan tertentu saja. Tes valid untuk bidang studi metrologi industri belum tentu valid untuk bidang yang lain misalnya midang mekanika teknik.[5]
B.     Tipe Validitas
Tipe validitas terbagi atas Validitas Isi (content), Validitas Konstrak (construct), dan Validitas Berdasar Kriteria (criterion-related). Validitas berdasar kriteria terbagi lagi atas tipe Validitas Konkuren (concurrent) dan Validitas Prediktif (predictive).[6]
1.      Validitas Isi
Validitas Isi berkaitan dengan pertanyaan mengenai seberapa lengkap butir-butir yang digunakan telah memadai atau dapat mengungkap sebuah konsep.[7] Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi sering juga disebut validitas kurikuler.[8]
Validitas isi juga mempunyai peran yang sangat penting untuk tes pencapaian hasil belajar. Validitas isi pada umumnya ditentukan melalui pertimbangan para ahli. Tidak ada formula matematis untuk menghitung dan tidak ada cara untuk menunjukkannya secara pasti. Akan tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi dengan menggunakan validitas isi, pertimbangan para ahli tersebut dilakukan dengan cara seperti berikut. Pertama, para ahli diminta untuk mengamati secara cermat semua item dalam tes yang hendak divalidasi. Kemudian mereka diminta untuk mengoreksi interpretasi item-item yang telah dibuat. Pada akhir perbaikan, mereka juga diminta untuk memberikan pertimbangan tentang bagaimnana baik interpretasi tes evaluasi tersebut menggambarkan cakupan isi yang hendak diukur.[9]
2.      Validitas Konstrak
Untuk menentukan adanya validitas konstrak, suatu tes dikorelasikan dengan suatu konsepsi atau teori. Items dalam tes itu harus sesuai dengan ciri-ciri yang disebutkan dalam konsepsi tadi. Yaitu konsepsi tentang obyek yang akan dites. Dengan kata lain, hasil tes itu disesuaikan dengan tujuan atau ciri-ciri tingkah laku (domein) yang hendak diukur.[10]
Proses melakukan validasi konstrak dapat dilakukan dengan cara melibatkan hipotesis testing yang dideduksi dari teori yang menyangkut dengan konstrak yang relevan. Misalnya jika suatu teori kecemasan menyatakan bahwa seseorang yang memiliki kecemasan lebih tinggi akan bekerja lebih lama dalam menyelesaikan suatu masalah, dibanding orang yang memiliki tingkat kecemasan rendah.[11]
3.      Validitas Konkuren
Validitas konkuren adalah derajat dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Validitas konkuren ditentukan  dengan membangun analisis hubungan atau pembedaan. Cara-cara membuat tes dengan validitas konkuren dapat dilakukan dengan beberapa langkah sebagai berikut.
a.       Administrasikan tes yang baru dilakukan terhadap grup atau anggota kelompok.
b.      Catat tes baku yang ada termasuk beberapa koefisien validitasnya jika ada.
c.       Hubungkan atau korelasikan dua tes skor tersebut.
Hasil yang dicapai atau koefisien validitas yang muncul menunjukkan derajat hubungan validitas tes yang baru. Jika koefisien tinggi, berarti tes yang baru tersebut mempunyai validitas konkuren baik. Sebaliknya tes yang baru dikatakan mempunyai validitas konkuren jelek, jika koefisien yang dihasilkan rendah.[12]
4.      Validitas Prediktif
Validitas prediksi adalah derajat yang menunjukkan suatu tes dapat meprediksi tentang bagiamana seseorang akan melakukan suatu prospek tugas atau pekerjaan yang direncanakan.
Dalam membuat validasi prediksi, suatu tes biasanya mempunyai sekuensi sebagai berikut. Pertama, mengidentifikasi dan mendefinisikan secara teliti criterion yang hendak diinginkan. Kriteria yang terpilih harus mengukur validitas terhadap tingkah laku yang diprediksi. Ketika kriteria telah diidentifikasi dan ditentukan, prosedur selanjutnya adalah menentukan validitas prediksi suatu tes.[13]
Validitas ini dimaksudkan agar hasil tes mampu memprediksi keberhasilan peserta didik di kemudian hari, misalnya ujian masuk atau tes seleksi.[14]
C.     Cara menghitung Validitas
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengatuhi kesejajaran adalah teknik korelasi product moment yang dikemukakakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a.       Korelasi product moment dengan simpangan.
Rumus korelasi product moment dengan simpangan:
rxy =   
dimana:
rxy = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang dikorelasikan (x = X-  dan y = Y- ).
 = jumlah perkalian x dan y
x2     = kuadrat dari x
y2    = kuadrat dari y
b.      Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan angka kasar:
RXY =       [15]

Validitas suatu tes dinyatakan dengan angka korelasi koefisien (r). kriteria korelasi koefisien adalah sebagai berikut:
ü  0,00 – 0,20 sangat rendah (hamper tidak ada korelasi)
ü  0,20 – 0,40 korelasi rendah
ü  0,40 – 0,70 korelasi cukup
ü  0,70 – 0,90 korelasi tinggi
ü  0,90 – 1,00 korelasi sangat tinggi.[16]
Penafsiran harga koefisien korelasi ada dua cara yaitu:
1.      Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup dan sebagainya.
2.      Dengan berkonsultasi ke tabel harga kritik r product moment sehingga dapat diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik tabel, maka korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.[17]
D.    Faktor-faktor yang mempengaruhi validitas
1.      Faktor yang berasal dari dalam tes
a.       Arahan tes yang disusun dengan makna yang tidak jelas sehingga dapat mengurangi validitas tes.
b.      Kata-kata yang digunakan dalam struktur instrumen evaluasi, terlalu sulit.
c.       Item-item tes dikontruksi dengan jelek.
d.      Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e.       Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
f.       Jumlah item terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran.
g.      Jawaban masing-masing item evaluasi bisa diprediksi siswa.
2.      Faktor yang berasal dari administrasi dan skor. Faktor ini dapat mengurangi validitas interpretasi tes evaluasi, khususnya tes evaluasi yang dibuat oleh guru. Berikut beberapa contoh faktor yang sumbernya berasal dari proses administrasi dan skor.
a.       Waktu pengajaran tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi yang tergesa-gesa.
b.      Adanya kecurangan dalam tes sehingga tidak bisa membedakan antara siswa yang belajar dengan yang melakukan kecurangan.
c.       Pemberian petunjuk dari pengawas yang tidak dapat dilakukan pada semua siswa.
d.      Teknik pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat mengurangi validitas tes evaluasi.
e.       Siswa tidak dapat mengikuti arahan yang diberikan dalam tes baku.
f.       Adanya joki (orang lain bukan siswa) yang masuk dan menjawab item tes yang diberikan.
3.      Faktor-faktor  yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item evaluasi tidak valid, karena dipengaruhi oleh jawaban siswa daripada interpretasi item-item pada tes evaluasi. Sebagai contoh, sebelum tes para siswa menjadi tegang karena guru pengampu mata pelajaran dikenal “killer”, galak dan sebagainya sehingga siswa yang ikut tes banyak yang gagal.[18]
E.     Pengertian Reliabilitas
Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen. Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.[19]
Tidak reliabel suatu tes pada prinsipnya dikatakan juga sia-sia tes tersebut karena jika dilakukan pengetesan kembali hasilnya akan berbeda. Reliabilitas tes pada umumnya diekspresikan secara numerik dalam bentuk koefisien. Koefisien tinggi menunjukkan reliabilitas tinggi. Sebaliknya jika koefisien suatu tes rendah maka reliabilitas rendah.[20]
F.      Cara-cara menghitung Reliabilitas
Menurut perhitungan product moment dari Pearson, ada tiga macam reliabilitas, yaitu koefisisen stabilitas, koefisien ekuivalen, dan koefisien konsistensi internal.
1.      Koefisisen Stabilitas
Koefisien stabilitas adalah jenis reliabilitas yang menggunakan teknik tes dan retest, yaitu memberikan tes kepada sekelompok individu, kemudian diadakan pengulangan tes pada kelompok yang sama dengan waktu yang berbeda.
Cara memperoleh koefisien stabilitas adalah dengan mengorelasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda.
2.      Koefisien ekuivalen
Koefisien ekuivalen adalah jika mengorelasikan dua buah tes yang paralel pada kelompok dan waktu yang sama. Metode yang digunakan untuk memperoleh koefisien ekuivalen adalah dengan menggunakan dua buah tes yang paralel. Syarat-syarat yang harus dipenuhi kedua tes paralel adalah krieria yang dipakai pada kedua tes sama, masing-masing tes dikontruksikan tersendiri, jumlah item, isi dan corak sama, tingkat kesukaran sama, petunjuk waktu yang disediakan untuk mengerjakan tes, dan contoh-contoh juga sama. Kemungkinan kesalahan pada teknik ini bersumber dari derajat keseimbangan antara dua tes tersebut, serta kondisi tempat yang mungkin berbeda pada kelompok tes pertama dengan kelompok tes kedua, meskipun dilakukan pada waktu yang sama.
3.      Koefisien Konsistensi Internal (belah dua)
Koefisien konsistensi internal adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari kelompok yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk tes yang pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik ini sering juga disebut split-half method. Split berarti membelah dan half berarti setengah atau separuh. Jadi split-half adalah tes yang dibagi menjadi dua bagian yang sama, kemudian mengorelasikan butir soal yang bernomor ganjil dalam belahan pertama (X) dan yang bernomor genap dalam belahan kedua (Y). Untuk membagi tes menjadi dua bagian dapat juga dilakukan dengan jalan megambil nomor soal secara acak, tetapi jumlahnya tetap harus sama untuk masing-masing kelompok. Disamping itu, pembagian tes dapat juga dilakukan dengan cara setengah bagian pertama untuk kelompok pertama dan setengah lagi untuk kelompok kedua.[21]
Jika hasil koefisien korelasi tinggi maka tes mempunyai tingkat reliabilitas baik. Akan dapat diartikan sebaliknya jika hasil korelasi belah dua item ternyata rendah. Perlu diingat bahwa dari analisis belah dua diatas, hasil korelasi yang muncul baru separo. Sebenarnya apa yang kita kerjakan adalah menciptakan secara artifisial dua macam kelompok ekuivalen dan menghitung bentuk reliabilitas ekuivalensi yang direncanakan terjadi dalam waktu yang sama. Oleh karena itu, analisis diatas dapat dikatakan sebagai reliabilitas atau konsistensi internal. Oleh karena reliabilitas yang digambarkan baru separo dari tes sebenarnya maka formula koreksi perlu digunakan untuk meningkatkan ketepatan perhitungan tingkat konsistensi. Formula koreksi yang digunakan adalah menggunakan korelasi Spearman-Brown yang dapat dilihat sebagai berikut.
rtotal tes =
Contoh penggunan rumus adalah misal dari hasil tes diketahui koefisien reliabilitas yang terdiri atas 50 item adalah 0,80. Harga ini menjadi dasar korelasi antara 25 item ganjil dan 25 item genap. Jika formula Spearman-Brown digunakan maka:
rtotal tes =  =  = 0,89
Jadi r tabel setelah dikoreksi adalah 0,89.[22]
G.    Faktor-faktor yang mempengaruhi Reliabilitas
Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi diantaranya sebagai berikut:
1.      Panjang tes; semakin panjang suatu tes evaluasi,semakin banyak jumlah item materi pembelajaran diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin mendekati kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak. Berarti akan semakin tinggi nilai koefisien reliabilitas.
2.      Penyebaran skor; koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas (Gronlund 1990: 94).
3.      Kesulitan tes; tes normatif yang terlalu mudah atau terlalu sulit untuk siswa, cenderug menghasilkan skor reliabilitas rendah.
4.      Obyektivitas: yang dimaksud dengan obyektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur evaluasi memiliki obyektivitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik penskoran.[23]


BAB III
PENUTUP
A.    Kesimpulan
ü  Valid, menurut Gronlund (1985) dapat diartikan sebagai ketepatan interpretasi yang dihasilkan dari skor tes atau instrument evaluasi.
ü  Tipe validitas terbagi atas Validitas Isi (content), Validitas Konstrak (construct), dan Validitas Berdasar Kriteria (criterion-related). Validitas berdasar criteria terbagi lagi atas tipe Validitas Konkuren (concurrent) dan Validitas Prediktif (predictive).
ü  Cara menghitung validitas yaitu dengan teknik korelasi product moment.
ü  Faktor-faktor yang mempengaruhi validitas: Faktor yang berasal dari dalam tes, Faktor yang berasal dari administrasi dan skor, Faktor-faktor  yang berasal dari jawaban siswa.
ü  Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen.
ü  Cara-cara menghitung Reliabilitas: Koefisisen Stabilitas, Koefisien ekuivalen, Koefisien Konsistensensi Internal (belah dua).
ü  Factor-faktor mempengaruhi reliabilitas instrumen evaluasi diantaranya sebagai berikut: Panjang tes, Penyebaran skor, Kesulitan tes dan Obyektivitas.


[1] Sukardi. Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya, (Jakarta: PT Bumi Aksara, 2009), 121.
[2] Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya, (Jakarta: PT Bumi Aksara, 2009), 30.
[3] Nana Sudjana. Penilaian Hasil Proses Belajar Mengajar, (Bandung: PT Remaja Rosdakarya, 2009), 149.
[4] Harjanto. Perencanaan Pengajaran, (Jakarta: PT Rineka Cipta, 1997), 288.
[5] Sukardi. Evaluasi …,31.
[6] Saifuddin Azwar. Tes Prestasi, Fungsi Pengembangan Pengukuran Prestasi Belajar,  (Yogyakarta: Pustaka Pelajar), 175.
[7] Zainal Mustafa EQ. Mengurai Variabel hingga Instrumentasi. (Yogyakarta: Graha Ilmu), 165.
[8] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi Aksara, 2009), 67.
[9] Ibid., 32-33.
[10] M. Ngalim Purwanto. Prinsip-prinsip dan Teknik Evaluasi Pengajaran, (Bandung: PT Remaja Rosdakarya, 2008), 138.
[11] Ibid., 33-34.
[12] Sukardi. Metodologi…, 124.
[13] Ibid., 125-126.
[14] Asep Jihad dan Abdul Haris. Evaluasi Pembelajaran, (Yogyakarta: Multi Pressindo, 2010), 179.
[15] Suharsimi Arikunto, Dasar-dasar …, 69-75.
[16] M. Ngalim Purwanto. Prinsip-prinsip…, 139.
[17] Suharsimi Arikunto, Dasar-dasar …, 75.
[18] Sukardi. Evaluasi…, 38-39.
[19] Zainal Arifin. Evaluasi pembelajaran. Prinsip, Teknik dan Prosedur, (Bandung: PT Remaja Rosdakarya, 2011), 258.
[20] Sukardi. Metodologi…, 128.
[21] Zainal Arifin. Evaluasi …, 259-261.
[22] Sukardi. Evaluasi…, 48.
[23] Sukardi. Evaluasi…, 51-52.
DAFTAR PUSTAKA

Arifin, Zainal. Evaluasi Pembelajaran, prinsip, teknik dan prosedur. Bandung: PT Remaja Rosdakarya, 2011.
Arikunto, Suharsimi. Dasar-dasar Evaluasi Pendidikan. Jakarta: PT Bumi Aksara, 2009.
Azwar, Saifuddin. Tes Prestasi, Fungsi Pengembangan Pengukuran Prestasi Belajar,  Yogyakarta: Pustaka Pelajar.
Harjanto. Perencanaan Pengajaran, Jakarta: PT Rineka Cipta, 1997.
Jihad, Asep dan Haris, Abdul. Evaluasi Pembelajaran. Jakarta: Multi Pressindo, 2010.
Mustafa EQ, Zainal. Mengurai Variabel hingga Instrumentasi. Yogyakarta: Graha Ilmu.
Purwanto, M. Ngalim. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: PT Remaja Rosdakarya, 2008.
Sudjana, Nana. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja Rosdakarya, 2009.
Sukardi. Evaluasi Pendidikan, Prinsip dan Operasionalnya. Jakarta: PT Bumi Aksara, 2009.
Sukardi.  Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya. Jakarta: PT Bumi Aksara, 2009.

Tidak ada komentar:

Posting Komentar