BAB 1
PENDAHULUAN
1.1
Latar Belakang
Tes merupakan salah satu alat ukur
guna mengukur keberhasilan proses dan hasil dari pembelajaran. Untuk itu
sebagai mahasiswa calon guru (konselor) perlu memahami kriteria tes yang baik
agar mampu menyusun tes yang baik pula. Tidak hanya mampu mengajar dan mendidik
dengan baik, guru yang professional hendaknya mampu menyusun tes yang dapat
mengukur keefektivan pembelajaran dan menilai kesuksesan dan pencapaian target
pembelajaran itu sendiri. Tes yang baik yaitu tes yang memenuhi beberapa
kriteria, yakni : validitas, reliabilitas, daya beda, objektifitas dan
standardisasi.
Penulis mencoba untuk menjabarkan
kelima kriteria tes yang baik tersebut diatas untuk menambah pemahaman penulis
dan pembaca makalah yang berjudul “Kriteria Tes yang Baik” ini. Selain itu
penulis juga mencoba untuk membuat perbandingan antara kriteria tes yang baik
menurut Suharsimi arikunto dengan beberapa ahli lainnya.
1.2
Tujuan
Tujuan dari pembuatan makalah ini antara lain sebagai berikut :
1. Untuk memenuhi
tugas matakuliah ‘Assesmen Tes’
2. Menjelaskan tentang
validitas, reliabilitas, daya pembeda dan tingkat kesukaran suatu test dan
bagaimana cara mengukurnya.
3. Dapat membuat
perbandingan beberapa kriteria tes yang baik menurut beberapa ahli.
4. Tujuan akhir dari
pembuatan makalah ini diharapkan agar penulis dan pembaca mampu membuat dan
menyusun tes yang baik.
BAB 2
PEMBAHASAN
Dalam bab
ini penulis menyajikan kriteria tes yang baik berdasarkan buku Dasar-Dasar
Evaluasi Pendidikan karangan Prof. Dr. Suharsimi Arikunto. Adapun beberapa
kriteria tyang akan dibahas adalah : validitas, daya beda, reliabilitas,
objektifitas dan standardisasai.
2.1
Validitas
A test is valid if it measures what
it purpose to measures (Scarvia B. Anderson, dalam Encyclopedia of Educational Evaluation). Artinya, sebuah tes
dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur.
Sebenarnya validitas ini bukan ditekankan pada tes itu sendiri, tapi pada hasil
pengetesan atau skornya.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis, dan hal kedua
diperoleh validitas empiris.
a. Validitas Logis
Yaitu jika sebuah instrument
evaluasi memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid
tersebut dipandang karena sudah dirancang sacara baik, mengikuti teori dan
ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis
tidak perlu diuji kondisinya tetapi langsung diperoleh setelah instrument
tersebut disusun.
Dua macam validitas logis yang dapat
dicapai oleh sebuah instrument :
·
Validitas Isi
Kondisi sebuah instrument yang
disusun berdasarkan isi materi pelajaran yang dievaluasi
·
Validitas Konstrak
Kondisi sebuah instrument yang
disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi
b. Validitas
Empiris
Sebuah instrument dapat dikatakan
memiliki validitas empiris bila sudah
diuji dari pengalaman. Validitas empiris tidak hanya diperoleh dengan menyusun
instrument berdasarkan ketentuan seperti halnya validitas logis, tapi harus
dibuktikan melalui pengalaman.
Dua cara yang dapat dilakukan untuk
menguji bahwa sebuah instrument memang valid :
·
Instrument yang sudah tersedia dan yang belum
ada tapi akan terjadi diwaktu yang akan datang (‘ada sekarang’/concurren validity)
·
Instrumen yang kondisinya sesuai dengan
kriterium yang diramalkan akan terjadi (‘validitas prediksi’/predictive
validity)
c. Cara Mengetahui
Validitas Alat Ukur
Teknik yang digunakan untuk
mengetahui kesejajaran adalah teknik korelasi product moment yang
dikemukakan oleh Pearson (dalam Suharsimi Arikunto). Rumus Korelasi product Moment dengan simpangan :
√(∑x2) (∑y2)
Dimana :
rxy
= Koefisien korelasi antara variable X dan Variabel Y.
xy = Jumlah perkalian X dengan Y
X2 = Kuadrat dari X
Y2 = kuadrat dari Y
2.2
Daya Beda
Daya
beda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai
berkemampuan tinggi dengan siswa yang berkemampuan rendah. Angka yang
menunjukkan besarnya daya pembeda disebut indeks diskriminasi (D).
Tiga
titik daya pembeda yaitu :
Daya pembeda Daya pembeda
Daya pembeda tinggi
Negative rendah (positif)
2.3
Reliabilitas
Reliabilitas adalah ketetapan suatu
tes apabila diteskan kepada subjek yang sama. Suatu tes dapat dikatakan
mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan
hasil yang tetap atau seandainya hasilnya berubah-ubah, perubahan yang terjadi
dapat dikatakan tidak berarti. Inilah yang dimaksud dengan reliabel.
Scarvia B. Anderson dalam buku
Suharsimi arikunto menyatakan bahwa persyaratan bagi tes yaitu validitas dan
reliabilitas ini penting. Sebuah tes mungkin reliabel tapi tidak valid.
Sebaliknya, sebuah tes yang valid biasanya reliabel.
·
Cara mencari besarnya Reliabilitas
a. Metode bentuk paralel
(equivalent)
Adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran dan susuan, tetapi butir-butir soalnya
berbeda. Kelemahan dari metode ini adalah pengetes harus menyusun dua seri tes
dan harus tersedia waktu yang lama untuk mencobakan dua kali tes.
b. Metode tes
ulang (test-retest method)
Metode
ini dilakukan untuk menghindari penyusunan dua seri tes. Pengetes hanya
memiliki satu seri tes tetapi dicobakan dua kali. Kemudian hasil dari kedua
kali tes tersebut dihitung korelasinya.tenggang waktu antara pemberian tes
pertama dan kedua jangan terlalu sempit dan jangan pula terlalu lama.
c. Metode belah
dua (Split-half method)
Dalam menggunakan metode ini
pengetes hanya menggunakan sebuah tesdan dicobakan satu kali. Pada saat
membelah dua dan mengkolerasikan dua belahan, baru diketahui separuh tes. Untuk
mengetahui keseluruhan tes harus digunakan rumus Spearman-Brown sebagai berikut
:
2r1/21/2
Dimana :
r1/21/2 = Korelasi antara skor-skor setiap belahan tes.
r11 =
Koefisien reliabolitas yang sudah disesuaikan.
2.4
Objektifitas
Objektif berarti tidak ada unsur
yang pribadi yang mempengaruhi. Sebuah tes dikatakan memiliki objektivitas
apabila dalam pelaksanaan tes itu tidak ada faktor subjektif yang
mempengaruhinya. Apabila dikaitkan dengan reliabilitas maka objektivitas
menekankan ketetapan pada sistem skoring, sedangkan reliabilitas menekankan
pada ketetapan dalam hasil tes.
Ada dua faktor yang mempengaruhi
subjektifitas dari suatu tes, yaitu :
1. Bentuk tes
Tes yang berbentuk uraian akan
member banyak kemungkinan pada si penilai untuk member penilaian menurut caranya
sendiri. Untuk itu dapat diminimalisir dengan membuat pedoman skoring terlebih
dahulu.
2. Penilai
Faktor yang dapat mempengaruhi
subjektivitas antara lain : kesan penilai terhadap siswa,tulisan, bahasa, waktu
mengadakan penilaian, kelelahan dan sebagainya. Maka penilaian atau evaluasi
harus dilakukan dengan mengingat pedoman penilaian.
2.5
Standardisasi
Pengertian tes standar secara sempit
adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang
khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi
syarat sebagai tes yang baik. Yakni
diketahui validitas dan reliabilitasnya baik validitas rasional maupun
validitas empirik, reliabilitas dalam arti teruji tingkat stabilitas, maupun
homoginitasnya.
Istilah ‘standar’ tidak mengandung
arti bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan
dapat mencapai suatu tingkat tertentu. Penyusunan tes standar selalu
mengusahakan agar sistem skoringnya sangat objektif sehingga diperoleh
reliabilitas yang tinggi. Apabila mungkin dilakukan dengan mesin, hal ini tidak
berarti bahwa bentuk tes standar harus selalu pilihan berganda. Tapi untuk
skoringnya diusahakan agar tidak terkena bias faktor-faktor lain.
Untuk menyusun tes standar
dibutuhkan waktu yang lama. Karena untuk memperoleh sebuah tes yang standar
melalui prosedur :
·
Penyusunan
·
Uji coba
·
Analisis
·
Revisi
·
Edit
BAB 3
PERBANDINGAN
3.1 Validitas
Dari beberapa referensi yang penulis
dapatkan baik dibeberapa blog maupun dalam buku-buku lainnya diantaranya : Metode Research (Penelitian Ilmiah),
karangan Prof Dr. S. Nasutionn, M.A. menarik
sekali karena buku tersebut memuat definisi validitas yang nyaris sama dengan
Suharsimi Arikunto, yakni ‘mengukur apa yang hendak diukur’.
Begitu pula dengan beberapa blog
yang didapati oleh penulis, diantaranya : Jawharie.Blogspot.com, Deswin
Purple.blogspot.com yang sepakat dengan Suharsimi Arikunto yang menjadi bahan
rujukan makalah ini.
Namun penulis menemui perbedaan dalam
buku Metode Penelitian
Naturalistik-Kualitatif yang juga merupakan karangan Prof Dr. S. Nasution,
M.A. beliau menyebutkan bahwa validitas membuktikan apa yang diamati oleh
peneliti sesuai dengan apa yang sesungguhnya ada dalam kenyataan. Namun setelah
penulis menelaahnya lebih jauh, tujan dari kalimat tersebut adalah sama, hanya
saja dalam buku ini Nasution lebih
menekankan pada penelitian naturalistik.
Selain itu, jika Suharsimi arikunto
menyebutkan bahwa secara garis besar terdapat dua macam validitas, yaitu
validitas logis dan validitas empiris. Maka lain halnya dengan Nasution yang
justru menyebutkan bahwa validitas alat ukur dapat diselidiki dengan Logika dan
statistik. Tapi untuk macam-macam Validitas
Suharsimi Arikunto dan Nasution sama-sama menyebutkan :
1. Validitas isi
2. Validitas
Konstruksi
3. Validitas Prediksi
/ prediktif
4. Concurrent
validity (hanya ada pada Suharsimi saja)
3.2
Daya Beda
Untuk daya beda penulis tidak
menemukan bahwa salah satu kriteria tes yang baik adalah mempunyai daya beda.
Bahkan dalam buku Suharsimi Arikunto sendiri justru memasukkan daya beda
kedalam masalah yang berhubungan dengan analisis butis soal. Hal ini juga
sedikit membingungkan lantaran dalam silabus matakuliah Assesmen Tes justru
memasukka daya beda kedalam salah satu kriteia tes yang baik, namun daya beda
juga didapati penulis dalam blog dengan alamat Jawharie.blogspot.com.
Hal ini juga dipahami penulis bahwa
salah satu kriteria tes yang baik adalah tes tersebut mampu membedakan siswa
yang mempunyai kemampuan tinggi dengan siswa yang berkemampuan rendah. Sehingga
hasil yang diperoleh oleh setiap siswa tidaklah sama mengingat kemampuan mereka
yang berbeda-beda.
3.3 Reliabilitas
Suharsimi Arikunto membahas
reliabilitas dalam bab khusus tentang reliabel, sementara Nasution dalam Metode
Research menggabungkan Validitas dan Reliabilitas dalam bab yang sama. Namun
baik Suharsimi Arikunto maupun Nasution mempunyai penjelasan yang sama
berkenaan dengan reliabilitas, meski dengan kalimat yang sama.
Dapat disimpulkan bahwa suatu alat
ukur dikatakan reliabel jika alat itu dalam mengukur suatu gejala pada waktu
yang berlainan senantiasa menunjukkan hasil yang sama (tetap), kalaupun
mengalami perubahan, maka perubahan yang terjadi dapat dikatakan tidak berarti.
Definisi serupa juga penulis
dapatkan dari beberapa blog lain, diantaranya ZadrianArdi.blogspot.com dan
Deswin Purple.blogspot.com.
3.4
Objektivitas
Tidak ada perbandingan yang penulis
dapati dalam kriteria Objektivitas ini, dari beberapa referensi yang telah
penulis sebutkan hampir semuanya sepakat bahwa yang dikatakan bahwa tes yang objektif
adalah tes yang apabila dalam melaksanakan tes tidak ada faktor subjektif yang
mempengaruhi terutama dalam sistem skoringnya.
Faktor yang mempengaruhi
subjektivitas dari suatu tes juga terdapat dua faktor, yaitu bentuk tes dan
penilai (deswin purple.blogspot.com)
3.5
Standardisasi
Sama halnya dengan daya pembeda, dalam
referensi yang didapati penulis standardisasi juga sebenarnya tidak dimasukkan
kedalam kriteria tes yang baik. Suharsimi Arikunto justru membahas dalam bab
lainnya dengan pembahasan tes standar. Setelah menjelajahi beberapa blog di
internet penulis juga tidak dapat menemukan tulisan yang memuat standardisasi
kedalam salah satu kriteria tes yang baik.
Standardisasi Justru dibahas secara
terpisah dalam bab Tes standar dan tidak standar. Namun penulis juga setuju
bahwa standardisasi merupakan salah satu dari sekian banyak kriteria tes yang
baik. Karena bagaimanapun juga tes yang baik hendaknya mempunyai standar
tersendiri, terutama dalam pedoman penskoran agar terhindar dari sifat
subjektif peneliti yang justru akan mengacaukan tes itu sendiri.
·
Dari beberapa pendapat para ahli yang penulis
sebutkan dapat dilihat bahwa tidak ada hal yang sangat bertentangan antara yang
satu dengan yang lain, justru para ahli saling melengkapi dalam merumuskan
kriteria tes yang baik sehingga dapat menjadi acuan bagi penulis dan pembaca
dalam membuat tes yang baik nantinya.
BAB 4
PENUTUP
4.1
Kesimpulan
·
Sebuah tes dikatakan valid apabila tes tersebut
mengukur apa yang hendak diukur. Sebenarnya validitas ini bukan ditekankan pada
tes itu sendiri, tapi pada hasil pengetesan atau skornya.
·
Daya beda soal adalah kemampuan suatu soal
untuk membedakan antara siswa yang berkemampuan tinggi dengan siswa yang
berkemampuan rendah.
·
Reliabilitas adalah ketetapan suatu tes apabila
diteskan kepada subjek yang sama. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap
atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan
tidak berarti.
·
Sebuah tes dikatakan memiliki objektivitas
apabila dalam pelaksanaan tes itu tidak ada faktor subjektif yang
mempengaruhinya. Objektivitas menekankan ketetapan pada sistem scoring.
·
Penyusunan tes standar (standardisasi) selalu
mengusahakan agar sistem skoringnya sangat objektif sehingga diperoleh
reliabilitas yang tinggi.
1 komentar:
sankyuu..membantu sekali artikelnya,, izin copas yah senpai.. :D
Posting Komentar