CIRI-CIRI
TES YANG BAIK
Tes yang baik
adalah tes yang dapat mengukur hasil belajar siswa dengan tepat. Untuk dapat
menghasilkan tes yang seperti itu maka tes tersebut harus dibuat melalui
perencanaan yang baik. Hal-hal yang perlu diperhatikan dalam membuat
perencanaan tes yang baik adalah ( http://pustaka.ut.ac.id/learning.php):
- Tentukan
tujuan pembelajaran yang ingin diukur.
- Pilih pokok bahasan dan sub-pokok
bahasan yang relevan untuk mencapai tujuan tersebut.
- Tentukan proses berpikir yang ingin diukur.
- Tentukan jenis tes yang tepat digunakan untuk mengukur tujuan pembelajaran tersebut.
- Tentukan
tingkat kesukaran butir soal yang akan dibuat.
Selain
itu, menurut para pakar sebuah tes dapat dikatakan baik sebagai alat pengukur
harus memenuhi kriteria yaitu: memiliki Validitas, Reliabilitas,
Praktikabilitas dan Objektivitas, Ekonomis. Adapun rinciannya sebagai berikut:
1)
Validitas
Sebelum menuju
kepenjelasan mengenai validitas, terlebih ada baiknya terlebih dahulu
mengetahui perbedaan antara ”Validitas” dan ”Valid”. ”Validitas” merupakan
sebuah kata benda, sedangkan ”Valid” merupakan kata sifat. Sebuah data atau
informasi dapat dikatakan valid apabila sesuai dengan keadaan senyatanya. Jika
data yang dihasikan dari sebuah instrumen tersebut valid, maka dapat dikatakan
bahwa instrumen tersebut valid, karena dapat memberikan gambaran tentang data
secara benar sesuai dengan kenyataan. (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 58).
Validitas merupakan ciri
yang amat penting, yang seharusnya dimiliki oleh setiap tes yang digunakan
untuk berbagai tujuan, termasuk tujuan pengajaran bahasa. Secara konvensional,
validitas diartikan sebagai ciri yang menunjukkan adanya kesesuaian antara tes
dengan apa yang ingin diukur dengan menggunakan tes itu. (Djiwandono, 1996: Tes Bahasa dalam Pengajaran, halaman
91).
Secara konvensional, Crocker
dan Algina (1986) membedakan validitas menjadi tiga, yaitu:
a.
Validitas isi
Validitas
isi menuntut adanya kesesuaian isi antara kemampuan yang ingin diukur dan tes
yang digunakan untuk mengukurnya. Kesesuaian itu tercermin pada jenis kemampuan
yang dituntut untuk mengerjakan tes, dibandingkan dengan jenis kemampuan yang
dijadikan sasaran pengukuran. Kesesuaian isi juga menyangkut cakupan bahan tes,
yang harus mencerminkan cakupan bahan dari kemampuan yang dijadikan sasaran
pokok tes.
b.
Validitas kriteria
Validitas
kriteria mengacu kepada kesesuaian antara hasil suatu tes dengan hasil tes lain
yang digunakan sebagai kriteria. Kriteria yang digunakan untuk menetapkan
tingkat kesesuaian itu dapat diambil dari tes sejenis yang diketahui
ciri-cirinya sebagai tes yang baik, dan yang diselenggarakan pada saat (hampir)
bersamaan. Validitas jenis ini dikenal sebagai validitas kesetaraan waktu. Validitas
kriteria dapat pula berupa validitas peramalan. Dalam hal ini kriteria yang
digunakan sebagai bahan perbandingan adalah hasil tes sejenis yang baik, yang
diselenggarakan setelah suatu waktu tertentu dan tahapan perkembangan kemampuan
tertentu.
c.
Validitas konstruk
Kesesuaian
antara hasil tes dengan kemampuan yang ingin diukur dapat pula ditinjau dari
konstruk, yaitu konsep atau teori yang mendasari penggunaan suatu jenis
kemampuan, termasuk kemampuan berbahasa. Pembuktian keberadaan validitas
konstruk sebagai sesuatu yang bersifat abstrak dan konseptual. Tingkat
rendahnya kadar validitas konstruk ditentukan oleh tinggi rendahnya koefisien
korelasi antara kedua deret skor yang dibandingkan, dengan menempuh prosedur
yang pada dasarnya sama dengan prosedur pembuktian keberadaan validitas
kriteria.
v Jenis-jenis validitas
Suatu tes dapat memiliki
validitas yang bertingkat-tingkat: tinggi, sedang, rendah, bergantung pada
tujuannya. Sehubungan dengan itu, ada beberapa jenis validitas, yaitu
(Purwanto, 2000: Prinsip-Prinsip dan
Teknik Evaluasi Pengajaran, halaman 138)
1. Content
validity (curricular
validity)
Suatu tes dikatakan memiliki Content validity jika scope dan isi tes sesuai dengan scope dan isi kurikulum yang sudah
diajarkan.
2.
Construct validity
Untuk menentukan adanya Construct
validity, suatu tes dikorelasikan dengan suatu konsepsi atau teori.
3.
Predictive validity
Suatu tes dikatakan memiliki Predictive validity jika hasil korelasi
tes itu dapat meramalkan dengan tepat keberhasilan seseorang pada masa
mendatang di dalam lapangan tertentu.
4.
Concurrent validity
Jika hasil suatu tes mempunyai korelasi
yang tinggi dengan hasil suatu alat ukur lain terhadap bidang yang sama pada
waktu yang sama, maka dikatakan tes itu memiliki Concurrent validity.
v Cara menghitung validitas suatu tes dapat
dilakukan antara lain sebagai berikut:
1.
Dengan product
moment correlation (Metode Pearson):
Rumusnya:
2.
Dengan rank
methodof correlation (metode Spearman)
Rumusnya:
2)
Reliabilitas
Kata reliabilitas dalam
bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris. Berasal
dari kata reliable yang artinya dapat dipercaya. Sebuah tes dikatakan dapat
dipercaya jika memberikan hasil yang tetap apabila diteskan berkali-kali. Jika
dihubungkan dengan validitas, maka validitas adalah ketepatan sedangkan
reliabilitas adalah ketetapan. (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 58).
Kehandalan atau
reliabilitas meliputi ketepatan/kecermatan hasil pengukuran,
keajegan/kestabilan dari hasil pengukuran. Kecermatan hasil pengukuran
ditentukan oleh banyaknya informasi yang dihasilkan dan sangat berkaitan dengan
satuan ukuran dan jarak rentang dari skala yang digunakan. Secara lebih tepat,
reliabilitas sebenarnya terkait bukan dengan tesnya sebagai alat ukur,
melainkan dengan hasil pengukurannya dalam bentuk skor yang ajeg.
Tentang syarat kestabilan
atau keajegan dari skor suatu tes, ada dua istilah yang perlu dikenal yaitu
keajegan internal dan keajegan eksternal. Keajegan internal adalah tingkat
sejauh mana sebuah tes itu homogen baik dari segi tingkat kesukaran maupun dari
segi bentuk soal dan prosedur menjawabnya. Sedangkan keajegan yang bersifat
eksternal, pokok permasalahannya adalah mengenai tingkat sejauh mana skor yang
dihasilkan dari penyajian sebuah tes kepada sekelompok orang akan tetap sama
sepanjang kemampuan orang-orang yang akan diukur tersebut masih belum berubah.
Surapranata, 2005: Panduan Penulisan Tes
Tertulis, halaman 27-28)
Sebagai ciri yang
pembuktiannya hanya dapat dilakukan secara empirik dengan perhitungan
statistik, tingkat reliabilitas dapat diketahui dengan menerapkan berbagai
metode perhitungan. Beberapa metode perhitungan tingkat reliabilitas yang biasa
digunakan yaitu (Djiwandono, 1996: Tes
Bahasa dalam Pengajaran, halaman 99-103).
a) Metode tes ulang
Perhitungan tingkat reliabilitas dengan
metode tes ulang mempersyaratkan pengguna tes yang sama dua kali, pada sejumlah
peserta tes yang sama. Metode tes ulang ini dilakukan dengan memperkecil
pengaruh faktor ingatan maupun faktor perkembangan kemampuan. Keduanya itu
cenderung mengaburkan koefisien realibilitas yang diperoleh dari perbandingan
skor-skor yang dihasilkan.
b) Metode tes setara
Untuk menerapkan metode ini perlu
dikembangkan dua buah tes yang setara, yang mampu menghasilkan skor yang sama
atau setara pula bagi kelompok peserta tes yang sama, tanpa mengulang
penggunaan tes yang sama.
c) Metode belah dua
Pada penerapan metode belah dua, tes yang
tingkat reliabilitasnya perlu dikaji cukup digunakan sekali terhadap sekelompok
peserta tes. Koefisien relialibitas suatu tes diperoleh melalui metode ini
dengan mengkorelasikan skor peserta yang dihasilkan dari pengerjaan butir tes
nomor genap, dengan skor peserta yang dihasilkan dari pengerjaan butir tes
nomor ganjil.
d) Rumus Kuder-Richardson atau K-R
Penyelenggaran satu kali tes dalam
penghitungan reliabilitas diterapkan pula pada metode Kuder-Richardson
(disingkat K-R), khususnya KR-20 dan KR-21, yang banyak digunakan untuk tes
buatan guru.
e) Koefisien alpha
Penerapan metode ini cukup sederhana, dan
hanya memerlukan perhitungan varian masing-masing butir soal, atau SD2,
dan varian seluruh skor, atau SDx2.
f) Koefesien antar penilai
Dalam penerapan metode ini, setiap
pekerjaan peserta tes dinilai oleh lebih dari seorang penilai,
sekurang-kurangnya dua orang. Masing-masing penilai melakukan penilaiannya
sendiri secara terpisah, atas dasar kriteria yang telah ditentukan sebelumnya.
g) Metode perkiraan
Metode perkiraan digunakan dalam perhitungan
tingkat reliabilitas, khususnya bagi tes buatan guru. Untuk itu dapat digunakan
dua macam tabel, satu untuk tes yang dikategorikan tes yang mudah, dan satu
lagi untuk tes yang sulit.
v Faktor-faktor yang dapat mempengaruhi
kehandalan suatu tes, yaitu (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 141)
1) Luas tidaknya sampling yang diambil.
2) Perbedaan bakat dan kemampuan murid yang
di tes.
3) Suasana dan kondisi testing.
3)
Praktikabilitas
Sebuah
tes dikatakan memiliki praktikabilitas yang tinggi apabila tes itu bersifat praktis,
mudah untuk pengadministrasiannya. Tes yang praktis adalah tes yang (Arikunto, 2009: Dasar-Dasar Evaluasi Pendidikan, halaman 62):
1).
Mudah dilaksanakannya; misalnya tidak menuntut
peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan
terlebih dahulu bagian yang dianggap mudah oleh siswa.
2).
Mudah memeriksanya artinya bahwa tes itu dilengkapi
dengan kunci jawaban maupun pedoman skoringnya. Untuk soal yang obyektif,
pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa dalam lembar
jawaban.
3).
Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga
dapat diberikan/ diawali oleh orang lain.
v Kriteria
untuk mengukur praktis-tidaknya suatu tes dapat dilihat dari (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 141-142)
a.
biaya yang
diperlukan untuk menyelenggarakan tes itu,
b.
waktu yang
diperlukan untuk menyusun tes itu,
c.
sukar-mudahnya
menyusun tes itu,
d.
sukar-mudahnya
menilai hasil tes itu,
e.
sulit-tidaknya
menginterpretasikan (mengolah) hasil tes itu,
f.
lamanya waktu
yang diperlukan untuk melaksanakan tes itu.
4)
Objektivitas
Sebuah tes dikatakan
memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor
subjektivitas yang mempengaruhi. Hal ini terutama terjadi pada sistem
skoringnya. Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan
pada skoring, sedangkan reliabilitas menekankan ketetapan dalam hasil tes.
Adapun dua faktor yang mempengaruhi subjektivitas dari suatu tes yaitu bentuk
tes dan penilai. (Arikunto, 2009: Dasar-Dasar
Evaluasi Pendidikan, halaman 61)
Selain itu, objektivitas
suatu tes ditentukan oleh tingkat kesamaan skor-skor yang diperoleh dengan tes
tersebut meskipun hasil tes itu dinilai oleh beberapa orang penilai. Untuk ini
diperlukan kunci jawaban tes (sooring key). Kualitas objektivitas
dapat dibagi tiga tingkatan yaitu (Purwanto, 2000: Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, halaman 141) :
1.
Objektivitas tinggi ialah jika hasil-hasil tes itu menunjukkan
tingkat kesamaan yang tinggi.
2.
Objektivitas sedang ialah seperti tes yang sudah
distandardisasi, tetapi pandangan subjektif skor masih mungkin muncul dalam
penilaian dan interpretasinya.
3.
Objektivitas fleksibel ialah seperti beberapa jenis tes yang
digunakan oleh LBP (Lembaga Bimbingan dan Penyuluhan) untuk keperluan counseling.
5)
Ekonomis
Yang dimaksud dengan
ekonomis disini adalah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos
atau biaya yang mahal, tenaga yang banyak dan waktu yang lama. (Arikunto, 2009:
Dasar-Dasar Evaluasi Pendidikan,
halaman 63).
DAFTAR
PUSTAKA
Anggota IKAPI. 2001. Penerbit Mandar Mundur
Arikunto,
Suharsimi. 2009. Dasar-Dasar Evaluasi
Pendidikan. Jakarta: PT Bumi Aksara.
Djiwandono,
Soenardi. 1996. Tes Bahasa dalam
Pengajaran. Bandung: Penerbit ITB.
Nasoetion,
Noehi. Suryanto Judu dan Adi.
2000. Hakikat tes, pengukuran dan penilaian. http://pustaka.ut.ac.id/learning.php.
Purwanto, Ngalim. 2000. Prinsip-Prinsip
dan Teknik Evaluasi Pengajaran. Bandung: PT Remaja Rosdakarya.
Surapranata, Sumarna. 2005. Panduan
Penulisan Tes Tertulis. Bandung: PT Remaja Rosdakarya.
Tidak ada komentar:
Posting Komentar